KARAKURI LMについてー日本語特化の国産大規模言語モデル（LLM）ー

低コスト×高性能を実現

「KARAKURI LM」は、カラクリが開発する大規模言語モデル（LLM)シリーズの総称です。日本のAI技術の発展のためにオープンモデルとして公開しています。

国産オープンモデルで最高性能を獲得した700億パラメータLLM「KARAKURI LM 70B v0.1」
世界で初めてAWS TrainiumでMoEモデルの学習に成功した「KARAKURI LM 8x7B Chat v0.1」
国産モデルで初めてAIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」

9つのスコア付けで学習・出力の精度をあげる学習方法

KARAKURI LMはSteerLMと呼ばれる特殊な学習方法を用いています。それによって、9つのパラメーター（使用するときに変更できる数値）の設定が可能です。出力時にパラメーターを変えることで、用途にあった出力を得ることができます。

多くの大規模言語モデルは学習データのラベル付けを「良い」「悪い」の２軸で設定することが多い中、KARAKURI LMは「Helpfulness」「Correctness」「Coherence」など9つのスコアでデータを学習させており、それによって少ないデータでも高精度な出力を可能にしています。

CPO中山智文　コメント

「KARAKURI LM」をオープンモデルとして公開した際、「なぜするのか？」というご質問をよく頂きました。その答えは２つあります。１つはカラクリの技術力を公平に評価していただきたいからです。多くの企業がモデルをクローズドにしており、実際にどのような評価を行い、どのような精度なのかもわからない状態で、「AI」を開発していることを謳っています。まだまだ駆け出しのスタートアップであるカラクリが信用していただくためには、オープンにすることで多くの技術者に評価していただくことが重要だと考えました。

もう１つは社会の知を拡げていくことに貢献したいという想いがあるからです。カラクリは「今までにないカラクリで世の中を豊かに」というミッションを掲げて創業した会社です。当時はR＆Dチームの全員が東京大学の大学院でのAI関連の研究を行っているメンバーでした。「巨人の肩の上に立つ」という言葉がありますが、AIやLLMの研究はまさにそのようなものだと思っています。私たちのモデルも多くの先人たちの研究の上に成り立っており、そこにいくつかの「今までにないカラクリ」を加えたことで高性能なモデルを実現することができました。その知見をまた社会に還元し、AGIやASI、ひいては豊かな社会の実現に少しでも貢献していきたい、そういう思いでモデルやノウハウの公開に踏み切った次第です。

カラクリはこれからも「今までにないカラクリ」を作り続け、オープンマインドと技術を持って「豊かな社会」の実現をしていきたいと思います。

KARAKURI LMについて

国産オープンモデルで最高性能※のLLM

低コスト×高性能を実現

特徴

質の高いデータ作成

学習コスト50％削減

オープンモデル活用

国内唯一 “９つのパラメーター設定 ”

ビジネス活用における強み

オープンソースモデルへのこだわり

CPO中山智文　コメント

ローカルLLM入門ガイド『KARAKURI TechBlog』

公開している「KARAKURI LM」の研究開発で得たノウハウや最新情報などを技術ブログとして公開しております。

Want more info?

KARAKURI LMについて
お気軽にお問合せください

KARAKURI LMについて

国産オープンモデルで最高性能※のLLM

低コスト×高性能を実現

特徴

質の高いデータ作成

学習コスト50％削減

オープンモデル活用

国内唯一 “９つのパラメーター設定 ”

ビジネス活用における強み

オープンソースモデルへのこだわり

CPO中山智文 コメント

ローカルLLM入門ガイド『KARAKURI TechBlog』

公開している「KARAKURI LM」の研究開発で得たノウハウや最新情報などを技術ブログとして公開しております。

Want more info?

KARAKURI LMについてお気軽にお問合せください

CPO中山智文　コメント

KARAKURI LMについて
お気軽にお問合せください