もっと詳しく

Pinecone(パインコーン)が2021年の創業時に発したメッセージは、データサイエンティストのニーズに特化したサーバーレスベクターデータベースを開発するというものだった。このデータベースは同社が行っていることの中核を成すものだが、同社はAI駆動型検索を中心に、より洗練されたデータベースの用途へと向かっている。「干し草の山の中から針を見つける」データサイエンティストを支援することを目指している。

Pineconeの創業者でCEOのEdo Liberty(エド・リバティ)氏に2021年、1000万ドル(約12億円)のシードラウンドの際に話を聞いたときはちょうど、同社がデータベースを開発しながらその道を歩んでいるところだった。同氏はAmazon(アマゾン)で、SageMakerというデータベースサービスの構築に携わっていた。それからがずいぶん長い道のりだったと同氏は話した。

「シードラウンドの発表から、いろいろと変化がありました。まず何よりも10月にきちんとした有料サービス製品を立ち上げました。それ以来、採用数も収益も急増しており、本当に順調です」とリバティ氏は語る。

シードラウンドの際、データサイエンティスト向けの専用データベースを用意した理由をこう説明した。

機械学習モデルが期待するデータは、JSONレコードではなく、高次元ベクトルなのです。それは特徴のリストか、エンベッディングと呼ばれる、この世に存在するアイテムやオブジェクトの数値表現です。この形式は、機械学習におけるセマンティックの観点で、豊かで実用的なものです。

現在では、この意味優先のアプローチが顧客にPineconeを利用してもらえる原動力になっているという。「ベクトルデータベースの主な用途は検索で、しかも広い意味での検索です。ドキュメントを検索するわけですが、ここでは検索を、情報入手全般、ディスカバリー、レコメンデーション、異常検知などと考えることができます」と語った。

システムは、Pineconeデータベースのデータを処理するために設計されたリソースのセットである「ポッド」で構成されている。同社は、顧客が製品に慣れ、簡単な概念実証を行うために、1つのポッドを無償で提供している。その後、ポッドの数に応じて支払いを開始する。

リバティ氏は、同社が数十億個のオブジェクトに拡張できるよう設計したシステムに自信を持っている。「ソフトウェアが実用に耐え、実際にオーケストレーションできる範囲まで拡張することができるのです。私たちは、インデックスを作成して使用できるデータ量に明確な制限がないようにシステムを設計しました」と同氏は説明した。

サーバーレスデータベースであるため、顧客はプロビジョニングについて心配する必要はないが、処理を要するデータ量に応じて、毎月いくら使えるかをPineconeに伝える必要がある。

「ざっくりとした計算に基づき、データ容量と性能の点から、こういう用途にはXポッドで十分だろうという判断が下され、それで完了です」。後はサインアップして、コンソールを数回クリックし、APIを呼び出してインデックスを作成するだけで、すぐに使えるようになる。

リバティ氏は、成長率や従業員数を明かしたくないとのことだったが、2023年にはスタッフ(それがどういう意味であれ)が2倍になる見込みだという。注目すべきは、シード発表時の同社の従業員数は10人だったことだ。

多様性に関して同氏は2021年「リクルーターには積極的に動き(より多様な応募者を見つけるために)、すばらしい候補者を逃さないように、そして多様な候補者を連れてくるように指示しました」と話した。実際には、その結果、2022年の新規技術職採用者の(従業員総数の)50%は女性だという。

同社は米国時間3月29日、2800万ドル(約34億円)のシリーズAを発表した。Menlo Venturesがリードし、新規投資家からTiger Globalが、また既存投資家から同社のシードラウンドをリードしたWing Venture Capitalなどが参加した。これにより、同社は累計3800万ドル(約46億円)を調達したことになる。

画像クレジット:SAND555 / Getty Images

原文へ

(文:Ron Miller、翻訳:Nariko Mizoguchi