生成AIの取り組み

カラクリは国産LLMモデルとして最高性能の評価を得た「KARAKURI LM」をはじめ、生成AIのビジネス実装を促進します。

KARAKURI LMについて

国産オープンモデルの中で
最高性能を獲得した大規模言語モデルです。

「KARAKURI LM」は、カラクリが開発する大規模言語(LLM)シリーズの総称です。学習に使うデータさえ質が高ければ、中小企業でもベンチャーでも独自のデータセットをもとに国際的競争力を持つAIモデルを開発可能だということを証明するため、さまざまなシリーズ開発に着手しています。

オープンソースで公開しているモデルのダウンロード
KARAKURI LM _ Media用_2@@2x

AWSジャパンの「AWS LLM 開発支援プログラム」を活用し、2023年9月より国内最大規模となる700億パラメーターのLLMを開発いたしました。2024年1月18日に、LLMのベンチマークテスト「Japanese MT-Bench」で性能評価を実施し、国産LLMモデルとして最高性能(※)の評価が採点されました。

特徴:

  • 開発費用 約744万円
  • 学習期間 3日間

世界で初めてAWS TrainiumでMoEモデルの学習に成功。総パラメータ数467億、推論時のアクティブパラメータ数129億の大規模言語モデル(以下、LLM)「KARAKURI LM 8x7B Chat v0.1」はベンチマークテストで国産オープンモデルとして最高点の評価を得ており、2024年5月7日に一般公開いたしました。

特徴:

  • 開発費用 30万円
  • 学習期間 3日間

国産モデル初・AIエージェントとして使えるLLM

Function callingとRAGの学習に成功。外部ツールを活用できる点という特徴を持つため「業界・企業特有のタスクのプログラミング」にも活用可能です。

  • 開発費用 約75万円

KARAKURI LMが得意なこと

セキュリティの高さ

カスタマイズの利便性

data_16

日本語での高い指示性能

ill_10

KARAKURI LMの最新情報

ABOUT

数学・物理オリンピックのメダリストが集うテクノロジーカンパニー

カラクリは東大大学院の機械学習研究室から発足したテクノロジーカンパニーです。自然言語処理・機械学習に関わるアルゴリズムを研究開発するR&Dチームには数学オリンピック、物理オリンピックのメダリストやアクセンチュア出身のエンジニアが集結し、プロダクトに実装することでテクノロジーの価値をすべての人が享受できる社会の実現を目指します。

tom

中山智文

CPO

シリコンバレーへ留学後、東京大学大学院へ進学。在学中に機械学習の社会実装を推進するため、2016年10月カラクリ株式会社を共同創業。東京大学大学院博士卒。

yoshida

吉田 雄紀

Tech Lead

東京大学医学部卒の現役医師でありながらデータサイエンティストという異色の経歴。数オリ銀メダリスト、量子コンピュータプログラミングコンテスト優勝。

画像

川端 大貴

R&D Team

東京大学大学院を卒業後、アクセンチュアに入社。アクセンチュアのエンジニア史上初の飛び級昇格を果たす。

nakashima

中嶋 恭久

Tech Lead

東京大学大学院卒、AWS LLM開発支援プロジェクトの中心メンバーで、国産モデル最高性能の「KARAKURI LM」の開発に従事

大日方 孝輝

大日方 孝輝

R&D Team

東京大学大学院博士卒、Gunosyデータハッカソン最優秀賞を受賞。東大駅伝記録メンバーの一人。

生成AIの研究開発のあゆみ

カラクリは2018年にTransformerを用いた言語モデルBERTの研究を開始し、その後もGPTを含めたLLMの研究に従事してまいりました。

 

2018年  ・transformerを用いた言語モデルBERTの研究開始
・正答率95%のAIチャットボット「KARAKURI chatbot」をローンチ
2019年  ・主力サービスである「KARAKURI chatbot」にBERT搭載
2021年  ・AIがユーザーの行動を予測するWeb接客機能を「KARAKURI chatbot」に搭載
2022年  ・GPTを含めたLLMの研究を開始
2023年  ・LLMを活用した協業企業とのPoCなどを進める専門チーム「カラクリLLMラボ」を発足
・企業ごとにカスタマイズできるCS特化型「Custom LLM」の開発に着手
・「AWS LLM 開発支援プログラム」に採択され、700億パラメーターの国産LLMモデルの開発に着手
2024年

   ・700億パラメーターのLLM、国産モデルの中で最高性能を獲得

 

生成AIのビジネス実装に強い理由

ビック・テックが注目する
スタートアップ

d25663-18-873574-0

2020 年に「Google for Startups Accelerator」、2022年に「Google for Startups Growth Academy Tech」採択。2023 年「AWS LLM 開発支援プログラム」と日本有数のスタートアップが採択されるプログラムに参加し、事業推進を学んでいます。

アクセンチュア、NRIなど大手コンサルタント出身者在籍

bdf7533a-e6f7-4198-a590-47d40bdc105b-1

アクセンチュア、NRIなどの出身者が多く在籍しております。金融をはじめ、小売・通信サービスなど大規模開発に従事した経験をもとに、適格なご提案が可能です。

LLMを自社開発

karakuri_data2

カラクリはGPTの活用等だけではなく、自社でLLMを開発しております。だからこそLLMの限界などを正確に把握し、それら知見をもとに現実的な実装を行えます。

生成AIを活用したプロジェクト実績

Q&Aコンテンツの作成業務を約40%省略化

当社では2020年からカラクリのAI検索技術を活用した、実務に関するQ&Aの検索システムを社内に展開しておりますが、Q&Aのメンテナンスについては手作業で行なっています。今回、カラクリの生成AIの技術を活用し、マニュアル等からQ&Aを自動作成するシステムを開発し、これによりQ&Aのメンテナンスにかかる作業時間を約40%削減できる見込みです。また、人では拾いきれないQ&Aを作成できるという効果も想定しています。

出典:明治安田生命保険相互会社(2024年1月22日)生成AIを活用した社内業務の効率化・高度化の取組開始について
 (https://www.meijiyasuda.co.jp/profile/news/release/2023/pdf/20240122_01.pdf)

明治安田生命ロゴ_jpegデータ

生成AIを活用したプロダクト

KKG_Image
icon_256x256 (2)-1

Want more info?

KARAKURI LMについて
お気軽にお問合せください