AKA Virtual Inc.
~複数モデルクラスにおいて日本語ベンチマーク最高スコアを達成~

Shisa.AI(本社:東京都港区)はこのたび、日英バイリンガル汎用チャットモデル「Shisa V2」シリーズの正式リリースを発表いたしました。
本シリーズは、業界標準ベンチマークにおいて日本語処理能力で圧倒的なスコアを達成するとともに、英語性能もトップクラスを維持する革新的なバイリンガルモデルです。特に、実運用環境でのコストパフォーマンスに優れた12Bおよび14Bパラメータモデルを新たに追加しました。7B・8B・12B・14B・32B・70Bのすべてのモデルサイズを、Apache 2.0やMITライセンス等のオープンライセンスのもと、HuggingFaceにて無料公開しています。
■ 進化のポイント
1.日本語処理能力の大幅向上
Shisa V2は、100万ダウンロードを突破したShisa V1からさらに進化し、業界標準ベンチマークにおいて複数のモデルクラスで1位を獲得しました。Shisa V2では、高コストな事前学習に代えて合成データを活用した訓練後最適化を重点的に実施し、以下の改善を実現しました。
-
出力の自然さ・文脈理解力の向上
-
翻訳やロールプレイなど、実用的なタスクにおける性能の向上

2.モデルファミリーの拡充
Shisa V2は、小型の7Bモデルから大型の70Bモデルまで、幅広い規模でのバージョンを公開しています。Qwen2.5やLlama3.1など各クラスのベースモデルから日本語処理能力が大幅に向上し、日常業務から専門的なタスクまで、あらゆるシーンで高い実用性を発揮します。


ライセンス |
モデル名(リンク) |
パラメータ数 |
日本語平均 |
英語平均 |
---|---|---|---|---|
Apache 2.0 |
7B |
71.06 |
54.86 |
|
Llama 3.1 |
8B |
70.83 |
54.75 |
|
Apache 2.0 |
12B |
72.83 |
53.33 |
|
MIT |
14B |
75.89 |
60.10 |
|
Apache 2.0 |
32B |
76.97 |
67.41 |
|
Llama 3.3 |
70B |
79.72 |
67.71 |
■ 独自の日本語ベンチマークを新規開発
Shisa V2モデルは従来の評価指標で高い性能を示すだけでなく、これまで測定が難しかった実用的なタスクにも焦点を当て、当社が独自開発した以下の日本語ベンチマークにおいても卓越した能力を発揮しています。
-
shisa-jp-ifeval:高度な日本語指示追従能力を評価
-
shisa-jp-rp-bench:複雑なロールプレイおよび複数ターンにわたる対話能力を評価
-
shisa-jp-tl-bench:高品質な日英翻訳能力を評価
これらのベンチマークは近日中にオープンソースとして公開し、日本における幅広いAI研究・開発コミュニティの発展に貢献していく予定です。
■ Shisa.AIについて
Shisa.AIは、シリコンバレー発の技術チームを中核とする次世代AIスタートアップです。シリコンバレーの先端技術と日本市場への深い洞察を融合させ、特に「日本語特化AI」と「データドリブン開発」の2つの柱で、オープンソースLLMの進化をリードしています。今後も日本語処理技術の最先端を切り開き、日本発のAIイノベーションを世界へ発信してまいります。
■ AKA Virtualとの戦略的提携について
AKA Virtualはこのたび、Shisa.AIの持つ日本語LLM技術の卓越性と将来性に注目し、2024年10月に戦略的提携を結びました。AKAのバーチャルアイドル事業においてShisa.AIの大規模言語モデル(LLM)技術を導入しております。特に、AKA Virtualが展開するAIキャラクターサービス「DE-AI」では、Shisaの先進的なLLM技術を中核システムとして採用し、高品質なユーザー体験を実現しています。
Contacts:
Shisa.AI公式ホームページ: https://shisa.ai/
HuggingFace: https://huggingface.co/shisa-ai
GitHub: https: https://github.com/shisa-ai
AKA Virtual公式ホームページ:http://www.akavirtual.com