2011年5月20日金曜日

独自の連想技術でインメモリ処理を実現する超高速BI「QlikView?

 1993年にスウェーデンで創業し、現在は米国ペンシルベニア州のラドゥナーに本拠地を置くQlikTech。同社は、設立当初にオフィスを構えていたスウェーデンのルンド大学と共同で研究開発を行っていたテクノロジーを基に、その特許を保持してビジネスインテリジェンス(BI)製品の開発に取り組んだ。

 「ユーザーが多次元データをクリックするだけで分析結果が表示できる」という意味で名付けられたBI製品「QlikView」は、1997年に発表されたQlikView 3.15を皮切りに、2000年代にはワールドワイドで成長著しいBI製品の1つとして評価されるまでになったという。

 2009年3月に日本への本格参入を開始したQlikTechは、国内総代理店だったサイロジックをQlikView Japanとして任命。その後、営業活動を本格化する中、サイロジックを統合する形で2010年1月に日本法人のクリックテック?ジャパンを設立している。

●データマートやOLAPキューブを設計する必要のないQlikView

 クリックテック?ジャパンの代表取締役 垣田正昭氏は、「QlikViewこそ開発者が集計作業の呪縛(じゅばく)から解放され Maple story rmt
る唯一のBIだと信じて、どうしても日本に普及させたかったのです」と語る。

 企業が分析を行う場合、一般的なスクラッチ開発では、勘定系基幹システムの詳細データを基に集計処理を行ってデータマートを構成することで分析フロントエンドを構築する。これは一般的なBIツールも同様だ。基幹系の詳細データはETLを介してデータウェアハウス(DWH)でいったん整理し、集計処理を行ってからデータマートやOLAPキューブを構成して、ユーザーインタフェースへとつなげる。ともにやっかいな集計作業が避けられない。しかも、スクラッチ開発や一般的なBIツールでは、新たな分析軸が必要になった場合、集計処理からデータマート、OLAPキューブ、フロントエンドまですべて作り変えなければならないこともある。

 QlikViewは、基幹系の詳細データを集計処理なしに独自の理論で超正規化し、直接QlikViewのドキュメントファイルに変換することで高速な分析が可能になるという。「QlikViewではデータマートやOLAPキューブを設計する必要がなく、これらの機能に拘束されません。仮に、20億件の大容量POSデータでも問題ありません」と垣田氏は言い切る。

●QlikViewの核となる「連想技術」と「インメモリ技術」 rmt アイオン


 QlikViewがそうした処理を可能にしているのは、人工知能にも使われる「連想技術」 (Associative Technology)を適用した特許技術を中心に、ハードウェアのパフォーマンス向上でより効果を増した「インメモリ技術」を応用することで、そこから派生するさまざまな利点を巧みに組み合わせているからである。

 では、連想技術とはどのようなものだろうか。一般のデータベースのソースは正規化データとしてHDDに格納されているが、例えば、赤い:普通車、青い:普通車、白い:普通車、赤い:トラック、黄色い:トラック、白い:トラックといった、色(項目名)や車種(値)のレコードが重複して保存されている。それをQlikViewの連想技術では、同じ項目名、かつ同じ値の情報は物理的に一度しか保持しないようにすることで、大幅にデータを圧縮する。また、項目間の関連はポインターによって把握し、元の情報を一切欠落させることなく維持できるようになっている。

 「ポインターとその先のデータは約5分の1?20分の1に圧縮できるため、超正規化データとしてすべてメモリ上に展開でき、HDDへのアクセスが不要になります」と説明するのは、クリックテック?ジャパン 営業部 部長 山浦研弥氏だ。HDDにアクセスせず、ソリッドなメモリ領域だけで処理が進
行するため、スピードは格段に向上するわけだ。

 また、ある情報から別の情報にはポインターで同方向に結び付けることができ、実質的に全項目を検索キーとして利用できるデータモデルが完成する。これらの処理が、QlikViewにデータを取り込むだけで可能になるという。垣田氏が20億件のデータでも問題ないと言ったのは、こうした連想検索と呼ばれる技術が利用できるからである。

 「事前集計が不要な上、直感的な検索機能やデータ構造の自動作成機能によって、エンドユーザー自身が好きなタイミングで分析を行えます。また、Microsoft Excelを使って分析目的のデータを抜き出し、QlikViewのサーバに格納することで、Excelの柔軟性を継承しつつ“データの出どころが不明”というExcel自体が抱える課題も解決することができます」(山浦氏)

●ハードウェアパワーの進化を見越して誕生したQlikView

 ただし、インメモリであることが高速化のすべてではないという山浦氏は、「連想技術によるデータ圧縮が可能になったため、たまたまインメモリをベースに選んだにすぎません」と打ち明ける。連想技術で特許を取り、QlikViewを製品化した1990年代後半?2000年代前半はメモリ?CPUとも性
能が低く、とてもビジネス用途には利用できなかったという。

 ところが、2004年ごろからCPUが64ビット化することでメモリのアドレス空間が拡大したとともに、CPUがマルチスレッド化?マルチコア化して並列処理が可能になったことで、QlikViewのパフォーマンスが一気に開花したのだ。

●最新版「QlikView 10」の新機能

 2010年11月に、クリックテック?ジャパンは最新版となる「QlikView 10」を発表した。新機能としては、連想検索をすべてのダッシュボード上のあらゆるリストボックスに拡張している。また、選択項目ごとに表示されるドロップダウンリストで絞り込みや変更が容易になるとともに、特定の分析を迅速に実行できるようになった。

 そのほか、Ajax機能を強化することで、リアルタイムでスムーズなデータオブジェクトの更新を可能にし、ハードウェアのマルチコア化を有効に活用するコアの計算機能拡張とマルチスレッドに対応したリロード機能を向上している。

 さらには、QlikView 10の統合ポイントをすべてドキュメント化してオープン化しており、地図やフローチャート、Flash動画などを、プラグインだけでオブジェクトの1つ
として表示することができるようになった。また、ユーザー統合のためのオープンフォーマット「QlikView Data Exchange(QVX)」を搭載することで、サードパーティー製システムのデータ出力を容易にしている。管理タスクとデータを外部から制御するためのAPIや、Webサイトとの統合を行うためのワークベンチも提供する。

 加えて、ロードバランシングや管理、更新スケジュールをはじめとする集中管理機能も提供し、エンドユーザーの監査ログやコンテンツ配信を詳細にコントロールすることで、コンプライアンス強化もサポートできるようにしている。

●状況に応じた柔軟な分析を可能にするプラットフォームが不可欠

 垣田氏は、「大量のデータ処理や情報配信などが目的のため、QlikViewは必ずしもBIとしてではなく、情報系プラットフォームとしても利用してもらいたいと考えています。実際にそういった事例もグローバルには存在します」と訴える。欧米に比べて日本の場合、BI導入に際して立派なKPIを作ろうと過剰に身構えたり、KPIを単純な割り切り方で決定したりする傾向があるという。「そうして作った方針で企業の営業担当者が行動することは非常に危険です。ビジネスは猪突(ちょとつ)猛進では成り立ちません。アメーバのように状況に応じて触手を伸ばしていくこと
が重要で、その指標として柔軟な分析を可能にするプラットフォームが不可欠となるでしょう」(垣田氏)

 時間を経るごとにパラメータは次々と変わり、原油先物価格や為替、金相場も刻々と変化する。「原油価格がどのレベルならビジネスが維持できるのか」といった、現実に即した細かい分析を行う柔軟性が、スクラッチ開発や一般のBIには欠落しているのではと垣田氏は指摘する。

 QlikViewでは、状況が変化するたびにキューブやデータマートの作成を情報システム部門に依頼することなく、ユーザー自身の手で数億件ものデータを参照し、分析が可能になる。しかも、Web検索と同様な気軽さで検索でき、データ間の重要な関係は直感的なインタフェースで表現される。

 また、QlikViewを利用する企業は、必ずしもBIを目的にしてはいない点も特徴的だ。「QlikViewが持つ独特の技術をいかに自社に役立てられるか、という視点で選択いただいているケースが多いようです」(垣田氏)。垣田氏によると、ショッピングカートの商品検索で利用したり、QlikViewの関連度把握という機能を生かして社内のシステム変更によるデータベースへの影響度評価に利用したりする事例もあるという。「アイデアは企業によってさまざま。BIという常識を超えた使い方を見つけてほしいですね」(垣田氏)


※関連記事:日本のティッシュはなぜ安い? 業界標準EDIが実現する日本型SCM
→www.atmarkit.co.jp/misc/ct.php?id=tt0Z0303

引用元:Perfect World rmt