株式会社SHIFT AI
OpenAI、Google、xAI…主要プレイヤーの動向と実用化のヒント
「日本をAI先進国に」を掲げ、AIのビジネス活用を学べるAI大学「SHIFT AI」を運営する株式会社SHIFT AI(東京都渋谷区、代表取締役 木内翔大)より、AIトレンド通信8月号をお届けします。
本号では、めまぐるしく変化するAI業界の最新情報を主要なAIツール別に、8月の注目すべきAI業界の動向を網羅的にご紹介します。

■主要AIツール別 8月最新動向ハイライト
■ OpenAI
「GPT-5」をリリース
・「PhD(博士)レベルの専門家」と称される理解力と説明力の高さ
・推論力、マルチステップ思考、連続的なタスク遂行能力の向上
・マルチモーダル(テキスト、画像、音声など)機能の完全対応
・長文、長期的な記憶のサポート
・「幻覚(ハルシネーション)」の大幅な減少、安全性や透明性の強化




GPT-5について詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/33397/
「gpt-oss」をリリース
・ChatGPTで有名なOpenAIが発表した、大規模言語モデルのオープンウェイトモデル
・誰でも自由にダウンロード、改変、商用利用が可能なApache 2.0ライセンスの下で公開
・ローカル実行が可能で、プライバシー保護やインターネットに依存しない利用が可能
・「gpt-oss-120b」と「gpt-oss-20b」の2つの推論モデルを公開
1. gpt-oss-120b
約1170億のパラメータの大規模モデルで高い精度を持ち、「o4-mini」とほぼ同等の性能で
長文処理やツール連携も可能で、高度な用途に違いがある。
2. gpt-oss-20b
約210億パラメータの軽量モデルで、「o3-mini」と同等の性能を持つ。
個人の高性能PCやエッジデバイスで使いやすく、小規模なシステムやローカル運用に向いている。
・Hugging FaceやGitHubから無料でダウンロードして利用可能
2025年内にインドのニューデリーに初のオフィスを開設し、現地採用を開始
アルトマンCEOは「インドのため、インドと共にAIを構築する」と述べ連携の強化を表明。
教育イベントやインド限定の新たな低価格サブスクリプション「ChatGPT Go」を発表し、最大級の海外市場インドで存在感を拡大。
Geminiアップデート
・Gemini Liveを強化
カメラ共有時に画像や画面上でハイライトする新しい視覚ガイドを導入。Googleカレンダー、Keep、ToDoリストと連携を開始し、メッセージ、電話、Googleマップとも順次接続。インドネシアや世界各地の主要な言語を含む順次展開予定。
・「一時チャット」機能が追加
最大72時間保存された後に自動で削除され、Google AIモデルのトレーニングにも使用されません。今後数週間で全ての「Gemini」ユーザーに展開される予定です。
・新機能「ガイド付き学習」を発表
画像、図、動画、インタラクティブなクイズなど、さまざまな形式で応答。問題をステップごとに分解し、ユーザーのニーズに合わせて説明を調整することで、知識やスキルの構築を支援。
・音声アシスタント「Gemini for Home」を発表
決められたコマンドでなくても、Geminiが文脈を理解して日常のタスクをサポート。
また、これまでは指示するたびに「OK Google」という必要があったが「Gemini Live」の搭載により、継続した対話が実現。
・画像モデル「Gemini 2.5 Flash Image」を発表
別名「nano-banana」。キャラクターの一貫性のいじや複数画像の融合など大幅にアップデート。
Gemini 2.5 Flash Imageについて詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/35113/
検索「AIモード」を拡張しグローバル展開
検索内のAIモードが強化され、レストラン予約などのエージェント機能を備えて180以上の国と地域に英語でグローバル展開を開始。日本でも展開は始まっているが現時点では英語でしか利用できない。
日本の大学生に向け、Gemini Proプランを1年間無料で提供
Gemini 2.5 ProやDeep Research、2TBのストレージ、NotebookLM Proなどが利用可能。
Google AI Proについて詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/26251/
Google スライドとGoogle VidsにAI画像編集機能が追加
画像背景削除に加え、背景編集が可能になり、デザインのスキルがなくても自由に画像をカスタマイズ。スライドやVidsのサイドバーからも「イメージを生成」アイコンを使って機能にアクセス可能。
Google DeepMindのAIモデル「Genie 3」が発表
ユーザーがリアルタイムで操作可能な動的世界を生成するAIシステム。豊富で多様なシミュレーション環境で無制限に訓練することが可能。※一般ユーザーは利用不可
Google Pixel 10シリーズ4機種を発表
新開発のTensor G5チップとGemini Nanoを搭載。カメラソフトウェア機能を大幅に刷新し、ジェスチャーでAI編集やアクション提案を実行。カメラでオブジェクトを横断する機能が搭載され、Geminiがリアルタイムでアドバイス。
■ Anthropic
Claude 4シリーズ (Opus 4/4.1) に、新たな安全機能が導入
会話が継続的に攻撃的または有害なものになった場合、Claudeは自ら会話を終了できるように。通常の利用ではほとんど遭遇しない「極端なケース」に限定して発動される。AIの安全性に対する業界の懸念に応えるもので、責任あるAI開発の姿勢を示しています。
「Claude Opus 4.1」をリリース
Opus 4を改良しエージェント型タスク、コーディングや推論能力がさらに向上。ベンチマークではOpenAI o3やGemini 2.5 Proを上回る性能を示している。特に「ハイブリッド推論」という即座の応答(短期推論)と、段階的に深く考える拡張思考(長期推論)の2つのモードを、入力内容に応じて自動で切り替える高度な仕組みにより複雑な問題もスムーズに対応可能に。
「Rakuten AI」を発表した楽天も、Opus 4.1の日常的なデバッグ業務における、高い精度を評価した。

Claude Opus 4.1について詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/33135/
Claude Codeの新機能「output-style」を発表
プログラミング学習者や開発者が自分の学習スタイルに合わせてClaudeとコミュニケーション方法をカスタマイズできるようになり、プログラミング初心者から経験豊富な開発者まで自分に合った学習モデルを見つけることが可能に。
Default:最短でタスクを完了させる実務向けスタイル
Explanatory(説明型):採用する実装方針やパターンを解説しながら生成
Learning(学習型):学びを促す「インサイト」を提示しつつ、一部のコード生成をユーザーに依頼
■ xAI
Grok 4が全てのユーザーが無料で利用可能
「エキスパート」を選択することで、常にGrok 4を使用可能。利用回数には制限があり、会話5回ほどで制限に達する。
Grok 4について詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/29813/
■ Perplexity AI
動画生成機能をリリース
音声付きビデオを生成可能。Proプランは月5本、Maxプランは月15本生成でき、ウェブ、iOS、Androidで利用可能。
■ Genspark
世界初!Apple Watchで使えるAI議事録アプリが登場
Apple Watchやスマートフォンで議事録を自動作成。さらにAIスライド、AIシート、AIドキュメントとも連携可能。
AI開発機能Genspark AI Developerをリリース
Claude Codeの登場を受けGensparkでも再実装。コーディング知識がなくてもアプリ構築が可能。
AIデザイナー機能をリリース
専門知識がない人でも高品質なデザインを簡単に作れる機能です。AIとの対話で、頭の中のイメージを直接デザインに反映できる。従来の画像生成AIと違い、生成されたデザインをAIへの追加指示や手動で自由に編集可能。
■Manus
大規模リサーチを可能にする新機能「Wide Research」リリース
数百件規模の情報を必要とするような複雑かつ大規模なリサーチを、AIエージェント同士の協力によって迅速かつ簡単に処理可能に。
Manusについて詳しく知りたい方はこちら
>https://shift-ai.co.jp/blog/18244/
■ Microsoft
Excel Labsに自然言語→数式の新関数「COPILOT()」を追加
文章で意図を伝えるだけで、表に合った数式や処理案を生成することが可能で、スクリプトを再実行したり、アドオンを更新する必要がない。既存の「Excel」関数との組み合わせも可能。
■その他AI関連注目ニュース
■ Meta
FacebookおよびInstagramにAIを活用したリアルタイム翻訳・吹き替え機能を導入
投稿動画を他言語に自動翻訳し、AIリップシンク技術により口の動きも自然に再現。英語とスペイン語間の変換から始まり、将来的には対応言語が拡大予定。最大20言語の音声追加や視聴者の言語設定による再生やクリエイターは言語別再生数の分析も可能。
■ DeepSeek
DeepSeek-V3.1をリリース
思考・非思考の2モードを1モデルで実現。SWE-bench Verifiedで66.0スコアを記録し、前世代を大幅に上回る性能を達成。圧倒的なコスト効率でエージェント時代に対応。

■ Anything
Create.xyzがAnythingへとリブランディングし大幅にアップデート
「バイブコーディング」(AIと対話しながらコードを書かずにアプリ開発する手法)を体現したサービスで、プログラミング初心者でもアイデアを入力するだけで本格的なアプリを構築なCreate.xyzがAnythingへとリブランディングし大幅にアップデート。高度な「推論(Reasoning)」機能の追加や、ネイティブファイルシステムを採用し、より大規模で複雑なアプリにも耐えうる設計に刷新したことでAIエージェントの賢さと対応範囲が飛躍的に向上。Webに加えてモバイル対応まで実現。
■ LINE
オリジナルAIキャラクターを生成できるチャット機能「AI Friends」を開始
ユーザーが自由にAIキャラをカスタマイズでき、SNSや顧客対応など多様な場面での活用が期待されている。
■ シャープ
対話型AIロボット「ロボホン」を発表(本体価格3万9,600円)
OpenAIのGPT-4o miniを活用した独自開発LLMを搭載。スマートフォンアプリと連携し、遠隔操作や共有の多機能な日常機能をリリース。
■ Alibaba
画像編集モデル「Qwen-Image Edit」を公開
広範囲補完やオブジェクトの追加・削除など精密な編集に対応。テキスト指示への忠実度を重視し、APIとデモ版をリリース。
■ ElevenLabs
音楽生成AI「Eleven Music」を発表
日本語に対応し、ジャンルや構成の自由な編集に加え、歌詞の変更も可能。レーベルやアーティストとのコラボにより、商用利用にも広く対応。
■ NTT
純国産AI「tsuzumi 2」10月公開
NTT版LLMであるtsuzumiのアップグレード版を10月にリリース予定。日本語性能において同サイズLLMにて世界トップクラスを目指す。
■ SAPジャパン
SAP® Business Data Cloudの一般提供開始とSAP® Business AIの主要機能強化を発表
AIをより実践的に活用し、ユーザー体験と業務効率を高める多くの新機能が追加。「SAP® Joule for Consultants」の正式提供を開始。
■ Hmcomm
生成AIによる対話型AIエージェント「Terry2」を正式リリース
文脈理解×タスク遂行=実用的な生成AIエージェント。通話ログを蓄積・分析し、「よくある質問」や「効果的な応答」を特定して改善に活用。
■ CoeFont
最新音声モデル「CoeFont V3 Fuji」を正式リリース
人間らしさと感情の再現性を追求した独自の最新AI音声モデル。感情表現の精度と自然な発話リズムの両立を実現。
■株式会社SHIFT AI 代表取締役 木内翔大 コメント
8月のAI業界も、非常に多くの重要なアップデートがありました。OpenAIの「GPT-5」リリースは、AIが以前よりもさらに高度な理解力と説明能力を持つようになりました。「PhD(博士)レベルの専門家」と称されるように、より複雑な推論や複数の手順を踏む思考、連続したタスクの実行が可能になり、テキスト、画像、音声など様々な形式の情報を扱えるマルチモーダル機能も完全にサポートされました。これは、AIが私たちの複雑な業務をより正確に、効率的にこなす未来が近づいています。
同時に、OpenAIが大規模言語モデルのオープンソース版である「gpt-oss」を公開したことも大きな変化です。これは、誰でも自由にAIモデルをダウンロードし、改変、商用利用できることを意味します。ローカル環境で実行できるため、プライバシー保護にも役立ち、インターネット接続に依存せずにAIを利用できます。特に軽量モデル「gpt-oss-20b」は個人の高性能PCでも使いやすく、AI活用の機会を広げるでしょう。
GoogleのGeminiアップデートも注目すべき点が多く、「ガイド付き学習」機能は、AIが画像、動画、クイズなどを通じて、ユーザーの知識やスキル構築を段階的に支援する新しい学習方法を提供します。また、Apple Watchで使えるAI議事録アプリ「Genspark」や、コーディング知識なしでアプリ開発ができる「Genspark AI Developer」、そして専門知識がなくても高品質なデザインをAIと対話しながら作成できる「Genspark AIデザイナー」の登場は、誰もがAIを使って新しいものを生み出すことができる環境が整いつつあります。
AIの進化は、私たちの働き方や学び方に大きな影響を与えています。これらの最新技術を理解し、活用できるスキルを身につけることが、これからのビジネスにおいて非常に重要です。私たちSHIFT AIは、「日本をAI先進国に」というビジョンのもと、これらの最新情報を皆様に提供し、実践的な学びの場を通じて、皆様一人ひとりのAI活用、そして日本全体のAI活用の推進に貢献してまいります。
【会社概要】

株式会社SHIFT AIは、「日本をAI先進国に」というビジョンのもと、生成AIをはじめとするAI技術のビジネス活用を学べる、利用者数No.1※のコミュニティ「SHIFT AI」を運営しています。会員数は2万を超え、法人向けのリスキリング支援サービス「SHIFT AI for Biz」や、教育機関向けの「SHIFT AI for School」など、幅広い分野でAI人材の育成を推進。さらに、独自メディア「SHIFT AI Times」の運営をはじめ、情報発信・研修・イベントを通じて、個人と組織の成長を支援し、日本全体のAI活用を加速させています。
社 名 株式会社SHIFT AI
所在地 東京都渋谷区渋谷2丁目24-12 渋谷スクランブルスクエア
代表者 代表取締役 木内 翔大
設立年月 2022年3月18日
資本金 8,300万円(資本準備金含む)
事業内容 コンサルティング / コミュニティ運営 / Youtubeチャンネル運営 / スクール運営
※利用者数No.1
GMOリサーチ&AI株式会社調べ
■調査項目/調査時点(2025年2月)における累計登録者数
■調査対象/企業が運営するAI活用事例や実践ノウハウなど、ビジネス目的でのAI活用に関する講義を提供するコミュニティサービスを対象とし、講義を行わないネットコミュニティや個人運営のコミュニティ、ビジネス目的以外のコミュニティサービスは対象外とする
【代表取締役 木内 翔大について】

木内 翔大(きうち しょうた)
株式会社SHIFT AI 代表取締役 / 一般社団法人生成AI活用普及協会 協議員 / GMO AI&Web3株式会社 AI活用顧問 / GMO AI&ロボティクス商事 AI活用アドバイザー
<X>
フォロワー数 13.2万人 (2025年8月現在)
「日本をAI先進国に」をテーマに生成AIについて発信。