AsterixDB: A Scalable, Open Source BDMS(AsterixDB:スケーラブルなオープンソースBDMS)

田中専務

拓海先生、最近部下が「AsterixDB」という論文を引き合いに出してきまして、うちでもデータ管理を見直すべきだと言われました。正直、何がどう違うのかよく分からず困っております。要するにどこが変わるんでしょうか。

AIメンター拓海

素晴らしい着眼点ですね!AsterixDBは「データをただ分析するだけでなく、格納・管理も一体で行う」システム群の一つで、大量データの管理をよりシンプルにすることを目指していますよ。大丈夫、一緒に整理しましょう。

田中専務

うちの現場は既存のデータベースといくつかのクラウドツールを繋ぎ合わせて使っています。投資対効果の観点で、なぜ一つのシステムにまとめる価値があるのですか。

AIメンター拓海

良い質問です。端的に言えば、データの移動や変換のコストを減らし、運用負荷を下げることでトータルコストを下げ得る点が大きな利点です。要点は三つに整理できます。第一に運用の単純化、第二にデータ整合性の向上、第三にクエリ性能の予測可能性です。

田中専務

なるほど。ところで技術面ではどんな特徴があるのですか。例えばNoSQLやインデックスの違いがよく分かりません。

AIメンター拓海

専門用語はあとで整理しますが、まず身近な例で。今のデータ管理を複数の工具箱で行っていると想像してください。AsterixDBは一つの大きな工具箱に、検索用の工具、地図用の工具、全文検索用の工具を最初から入れておくような設計です。NoSQL(NoSQL)=スキーマに縛られないデータの扱い方を柔軟にし、LSM-based storage(Log-Structured Merge-tree、書き込み効率重視のストレージ)などを使って大量データを扱う工夫をしているのです。

田中専務

これって要するに、うちが今やっている『データを移して加工してから分析する』という手間を減らせるということ?そこが一番のポイントですか。

AIメンター拓海

その通りですよ。要するに三つです。まずデータ格納と検索を同じ土台でできるため、データ移動やフォーマット変換が減る。次に複数のインデックス(B+-tree、R-tree、全文索引など)が最初から使えるので検索の幅が広がる。最後に継続的なデータ取り込み(data feeds)が前提になっているため、センサーやログのような常時流れ込むデータの扱いが楽になります。大丈夫、一緒にやれば必ずできますよ。

田中専務

運用面ではどれくらい手間がかかりますか。うちにはIT担当が少なくて、クラウドツールも使い慣れていません。導入に人手や時間が必要なら現実的ではないのです。

AIメンター拓海

不安は当然です。運用負荷を評価するポイントは三点です。既存データの量と形式、リアルタイム性の要件、そして可用性の要件です。まずは小さなパイロットでデータの流れを1本だけ移してみることを提案します。できないことはない、まだ知らないだけです。

田中専務

わかりました。最後に、要点を私の言葉で言い直してみます。AsterixDBはデータを一か所でためて色々な検索や解析ができるようにした仕組みで、移動や変換の手間を減らし、検索の幅を広げ、常時取り込みに強いということですね。

AIメンター拓海

まさにその通りですよ。素晴らしい着眼点ですね!次は実際の事例を一緒に見て、パイロット設計をしましょう。大丈夫、一緒にやれば必ずできますよ。

AIBRプレミアム

関連する記事

AI Business Reviewをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む