Project [Kuzira]

新たなデータの可能性を追求する人々に、よりハイパフォーマンスなデータベースを提供する

Project「Kuzira」とは

巨大データを意識させず、誰でも大規模なデータを自由に扱えるようにするためのデータ環境創造を目指す社内プロジェクトです。
地球上最大の哺乳類「クジラ」をコンセプトとしました。

Project [Kuzira]の目指すもの

これからのデータドリブンビジネスを快適にする

昨今ビジネスにおけるデータ活用は当たり前となり、改制個人情報保護法の適用で、データのビジネス活用がより本格化する事も想定されます。
しかし、誰でも簡単に大規模なデータを活用するための環境は現在乏しく、更に行・列共に大規模化するデータを簡単に扱え、スケールも柔軟にできるようなデータベースの選択肢がない状態です。
Kuziraプロジェクトで、私たちは、現在利用のハードルが高くなる様々なデータの様式に対応する、新しいデータベースマネジメントシステム群の開発を行う事を目指しています。

行・列ハイブリッド指向DBMS [Kuzira]

データベースマネジメントシステム [Kuzira] とは

[Kuzira]は、今までになかった「分散型行・列ハイブリッド指向データベース環境」です。

列指向データベースでSQLの使えるものもありますが、分散処理の際のアーキテクチャーの問題で、列側のデータの規模が大きくなるとパフォーマンスが著しく低下するという問題があります。
また、サーバ環境の機能に大きく依存しているなど、特定の環境以外で稼働しないことも、汎用性の面でビハインドになります。

私たちは、この分野で「様々な環境で稼働する汎用性」と「列指向データを高速で快適に扱える」という2点を突き詰め、SQL利用ができ尚且つ上述の2点をクリアした、新しいDBMSを創り出します。

Hadoopなど大規模分散環境を構成し稼働するには小さいが、RDBMSでは扱えないようなミッドレンジデータ(列データ数千〜1万程度、レコード数数億〜10億程度)を汎用のSQLで簡単に操作でき、柔軟な分散環境構築を可能にし、既存のRDBMS環境構築・運用と変わらない操作性を実現する、新しいコンセプトの「行・列ハイブリッド指向データベース」を目指します。

Kuzira for IoT (仮称) コンセプト

Kuzira for IoT とは

従来のデータベース環境で、IoT各種サービスなどの大量のトランザクション負荷のかかるサービスでの環境構築となると、多くのリソースを割当て、大規模な分散環境を用意して対応するなどの措置が必要であり、また、リアルタイムなレスポンスを返すようなサービスを構成しようとすると、そのための投資額が巨大化し、とてもベンチャー企業が手軽に参入できるような額ではなくなるという状況です。

Kuzira for IoTコンセプトは、「より小規模な投資額(小規模な環境)」で「大量のトランザクションを扱うレスポンス性」に特化した、IoTプラットフォーム特化型DBMSです。

行・列ハイブリッド指向型DBMS [Kuzira]のアーキテクチャーをベースに、IoTサービスに求められる高速データ格納、ハイレスポンスを実現する新しい環境を創り上げます。

現在の活動

DataMatix ∞(仮称) V1.0 コアプラットフォーム開発

従来の大規模データ環境に存在する データ追加問題を解決するアーキテクチャーの分散データベース環境

DataMatix for IoT (仮称) 構想

既存のデータストレージ環境にあるストリーム処理問題を解決する新しい構造のストリームデータ処理特化型データプラットフォーム

アーキテクチャー概要

アーキテクチュア3大特徴

  1. MPP/並列DB
  2. 汎用RDBMS(MariaDB or Postgres)を利用
  3. 列指向性を中心に行指向性も活かすハイブリッド設計

並列データベースシステム

  • データベースの関係演算を高速に実行することが目的
  • 結合(Join)処理の並列化
  • Sort処理の並列化
  • 性能追求型のシステム
  • トランザクション処理よりも複雑な分析問い合わせを処理する
  • PostgreSQL,MySQL単体だとデータウェアハウスのベンチマーク標準TPC-Hで10GBも満足に処理できない

Shared-nothing (無共有型)

  • Hard to program/ Cheap to build / Easy to scale-up
  • Teradata, Greenplum等、現在の並列データベースで主流の構成
  • MapReduce等も同構成
  • 一般的に同期処理の少ないバッチ処理/分析タスクに適する

datamatix-infinity

Kuzira DBのマーケット

データ分析分野でのOne and OnlyのDBMS

Kuzira DBのニーズが最も多く存在するのが、マーケティング領域やリサーチ領域、いわゆる「データ解析」分野での利用です。
従来この分野で、いわゆるシングルテーブルで柔軟に情報の入出力や編集・集計を行えるデータストレージのバックエンドになるDBMSが乏しく、APIを利用して集計したり、特定のプラットフォームでしか利用できないものはあったものの、どれも一長一短で、柔軟性やパフォーマンス面で、より活躍する範囲の広い、解析データを取り扱うために考え抜かれたDBMSが望まれていました。

Contact to Kuzira Project

Kuziraに関するお問い合わせは下記フォームよりお問い合わせください。

Contact
株式会社dbE
partner Microsoft