カテゴリー

Galirage Research、ExcelファイルのXML化によるRAGの精度改善に関する論文を発表

  • URLをコピーしました!

株式会社Galirage

株式会社Galirage、研究開発部門を本格始動し、業務効率化や新たなAI活用の可能性探究の加速化を目指す。当社初の研究論文をarXivにて発表。

株式会社Galirage(本社:神奈川県川崎市、代表取締役:森重真純、以下「Galirage」)は、研究開発部門であるGalirage Researchを本格始動、1本目の研究論文を発表しました。

Galirage Researchでは、現場での実践的な課題に根ざした研究を推進することで、業務効率化や新たなAI活用の可能性を探求していきます。企業としての「技術的な優位性」を醸成し続けるために、2025年は研究開発への大型投資を行い、年間12本の論文公開を目標としています。

今回、Galirage Researchの第一歩として、arXivにて初の論文を発表しました。

本論文では、Excelファイル内のフローチャートに対して、Vision-Language Model(VLM)やLarge Language Model(LLM)を用いて、RAGをすると精度が低くなる課題について、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、精度改善する可能性を示唆する内容となっています。(論文はこちら

■論文概要

タイトル:Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions

これまでの課題:従来、Excelファイル内のフローチャートに対してVLM / LLMを用いた情報検索(RAG)を行うと、精度が低下し誤った回答(ハルシネーション)が発生するという課題がありました。

本論文での検証と結果:本研究では、ExcelファイルをXML形式で読み込み、AIが解読しやすいデータ前処理を実施。その結果、従来手法ではハルシネーションを起こしていた課題において、より正確な回答を生成することに成功しました。

考察:この研究により、特定のシナリオにおいて、OfficeファイルのXML化(および前処理)によるデータのエンリッチ化により、LLMによる回答精度やRAGの検索精度が改善する可能性を示唆しました。

論文URL:https://arxiv.org/abs/2502.04389

今後の研究成果や発表についても、随時ご報告してまいりますので、ぜひご注目ください。

■会社概要

  • 名称:株式会社Galirage(Galirage Inc.) ※ 「ガリレージ」と発音します。

  • 住所:〒210-0007 神奈川県 川崎市 川崎区 駅前本町 11番地 2 川崎フロンティアビル 4階

  • 代表取締役CEO:森重 真純

  • メンバー数:取締役 3名、正社員 10名、業務委託 90名

  • 支援先企業:73社(内プライム上場企業:18社)

  • 設立日:2023年5月9日

  • 事業内容:生成AIシステム開発事業、生成AIコンサルティング事業、生成AIアドバイザリー事業、生成AIメディア事業、生成AIニュース配信事業、RAGコンペ事業(raggle.jp)

  • ホームページ:https://galirage.com/

  • YouTube:https://youtube.com/@masumi_engineer/

  • ウェブ本(無料教材):https://zenn.dev/umi_mori?tab=books

  • 書籍『AIとコミュニケーションする技術』(インプレス社):https://amzn.to/3ME8mLF

  • お問い合わせ:https://forms.gle/G5g1SJ7BBZw7oXYA7

出典:PR TIMES

本プレスリリースの内容や詳細についてのお問合せは以下までご連絡ください。

企業プレスリリース詳細へ (2025年2月14日 09時00分)

大手通販サイトのあらゆる商品の価格を比較、最安値を検索!

まずはお好きなキーワードや商品名を入力して探してみましょう
×
よかったらシェアしてね!
  • URLをコピーしました!
目次