インフィニティソリューションズ株式会社ブログ

ビッグデータとクラウド:まだ正解がない問題点とは

一時期はクラウド、クラウドであったが、最近はビッグデータの方が良く目にする言葉になった感もある。ビッグデータとクラウドを組み合わせれば、誰でも処理できてしまう環境が整いつつある。しかしながら、まだ良くわかってない点があるから注意せよ、との記事。

Infoworldの記事から。

Big data and cloud computing: Watch out for these unknowns(ビッグデータとクラウドコンピューティング:これらの不明点に注意せよ)

InfoWorld

“Management of both structured and unstructured data, which is an advantage of using a nonrelational database, could mean that the unstructured data is much harder to deal with in the longer term. At some point, we’ll have to make tough calls around converting unstructured data to structured form. The trouble is that many of the initial design database implementations will be difficult to change once they’re in production.”

「構造化データと非構造化データの両方の管理は、非リレーショナルデータベースを利用することの利点であるが、非構造化データは長期的により扱うのが難しいことを意味している。ある段階で、非構造化データを構造化した形に変換するかどうかの難しい選択を余儀なくされるだろう。問題は、本番運用に入ってしまえば、初期デザインのデータベース実装を変更することが難しいことだ。」

“The cost of using local servers is going to be high for those who won’t, or can’t, move to cloud-based platforms. We’re talking hundreds to thousands of servers that have to be loaded, powered, and maintained. Although you can avoid the cost of traditional enterprise software licensing, the raw processing power required will still drive many big data implementations over budget. I suspect many big data efforts will initially occur within data centers, where the big data expenses are intermingled with the overall data center costs; count on the final tallies to be a surprise.”

「クラウドベースのプラットフォームに移行しない、あるいは、移行できないものにとって、ローカルサーバを使用するコストが高くなるであろうということだ。ここで言っていることは、何百から何千のサーバに実装し、動かし、維持しなければならないということだ。従来のエンタープライズソフトウェアのようなライセンスコストは要らないが、ビッグデータの実装には、純粋に必要な処理パワーで予算オーバーになるだろう。ビッグデータを手がける多くの場合、当初はデータセンター内で行われ、その場合、ビッグデータの費用は全体のデータセンターのコストに紛れ込んでいるが、最後に勘定を見て驚くことになる。」

“Cloud-based big data servers are not at all the same. Amazon Web Services provides very different offerings than Google, for example, and capabilities differ between any pair of platforms you compare. Thus, the amount of time, effort, and talent required to get big data projects to their end state also vary, due to differences in technology. I suspect one or two platforms will emerge as the clear paths to success, but we’re not there yet.”

「クラウドベースのビッグデータ・サーバは全て同じというわけではない。例えば、Amazon Web Servicesは、Googleとは全く異なるものを提供し、機能は比較するプラットフォーム間で異なる。したがって、技術的に異なっているため、ビッグデータ・プロジェクトを最終段階までもたらすために必要な時間、労力、人材も異なってくる。いずれ1つか2つのプラットフォームが成功への明らかな道筋として浮かび上がってくると思うが、まだそこまで至っていない。」