The Swiss voice in the world since 1935

スイス国産の大規模言語モデル その強みと限界

LLMと対話中のスクリーン
Keystone / Gaetan Bally

最近発表されたスイスの純国産大規模言語モデル「アペルトゥス」について、巷で飛び交う様々な意見や見解についての真偽を検証した。

人々の注目が集まるなか、スイスの大規模言語モデル(LLM)「アペルトゥス(Apertus)」が9月2日、発表された。共同開発したスイス連邦工科大学チューリヒ校(ETHZ)、同ローザンヌ校(EPFL)、スイス国立スーパーコンピューティングセンター(CSCS)によると、アペルトゥスは「完全な公開」(モデルを構成するプログラム・データ・実行条件などが全て公開されていること)を保証する「生成AI(人工知能)の透明性と多様性における画期的な成果」だ。

アペルトゥスの対応可能な範囲とその限界については、公開後に様々な意見や見解が飛び交っている。しかし、何が正しくて、どれが間違っているのだろうか。

スイスインフォはアペルトゥスを独自に試すとともに、開発者やAI分野の専門家に取材し、これらの意見や見解の真偽を精査、アペルトゥスの強みと弱点を浮き彫りにした。

(1)アペルトゥスはスイス版ChatGPTだ →誤り

アペルトゥスは米オープンAIのChatGPTのような、一般的な個人利用を目的に設計されたものではない。様々なアプリケーションやサービス、特に商業や研究への応用を想定して開発された基盤AIモデルだ。例えばEC(電子商取引)機能の強化や、医療情報の多言語抽出などに利用できる。

ETHZの研究者でアペルトゥス技術開発チームリーダーのイマノール・シュラーク氏は「一般利用を主なユーザー対象とはしていない」と話す。

このため、公開されたアペルトゥスには様々なユーザー向け機能や専用モバイルアプリなどはついていない。

CSCSのアソシエイト・ディレクターでユーザープログラム・ロードマップの責任者を務めるマリア・グラツィア・ジュフレーダ氏は「私たちの目的は決してスイス版ChatGPTを開発することではなかった」と断言する。アペルトゥスの学習・モデル構築はスイス南部ルガーノにあるCSCSのスーパーコンピューター(スパコン)Alps(アルプス)で実行された。

非政府組織(NGO)のパブリック・エーアイ(Public AI)は、一般ユーザーもアペルトゥスを試せるようにチャット機能をウェブ上で公開外部リンクしている。

2025年のスイスのAI最新動向について詳しくはこちら

おすすめの記事
スイスでは2025年、人工知能(AI)のアルゴリズムを多用するソーシャルメディアへの規制が強化される

おすすめの記事

スイスのAI

「スイス版ChatGPT」、無人運転車解禁…2025年スイスのAI最新動向

このコンテンツが公開されたのは、 医療などに特化した「スイス版ChatGPT」、無人運転車の一部解禁――。スイスの人工知能(AI)開発分野は今年、大きく変化する。DXの権威マイケル・ウェイド氏がその動向を分析した。

もっと読む 「スイス版ChatGPT」、無人運転車解禁…2025年スイスのAI最新動向

(2)広く利用されているLLMとは競合できない →正しい

アペルトゥスの最大バージョンは700億パラメーター(学習能力を示す値)で、完全公開のLLMモデルとしては著者の知る限り最も強力だ。だがGPT-4、 Gemini、 Claudeのような独占的モデルはデータセットの規模も計算機能力もはるかに大規模で比較にならない。例えば最新世代GPT-5より古いGPT-3でも1750億パラメーターの能力がある(以降のバージョンの詳細は非公開)。

フランス・パリのエコール・ポリテクニークのエル・マディ・エル・ムハンディ助教は「アペルトゥスを米国の巨大テック企業のAIモデルと比較するのは、スイス・ヴァレー(ヴァリス)州の小規模農家と大規模牛肉生産者を比べるようなものだ」と例える。

だが小規模モデルは中小企業にとってより効率的で利用しやすい上、エネルギー消費量も抑えられるという利点がある。EPFLとスイスイタリア語大学(ルガーノ大学)の博士課程の学生でアペルトゥス開発メンバーの1人のメテ・イスマイルザーデ氏は「データの量よりも質の方が重要だとの認識が高まっている」と長所を強調する。

巷の知識人の中には懐疑的な見方もある。チューリヒ大学名誉教授のブルーノ・フレイ氏(政治経済学)はアペルトゥスが間違った科学的情報源を提示したとし「あまり説得力がない」とコメントした。スイスの数学者、ザビエル・コンテス氏はソーシャルネットワークLinkedInに、アペルトゥスは一見正しそうだが明らかに間違った結果(ハルシネーション)を大量に出力する」と投稿した外部リンク

これに対しシュラーク氏は、アペルトゥスはより小規模なバージョン(80億パラメーター)であっても、Mistral、 Meta、 Alibabaの同等LLMモデルや、公的研究機関が開発するどのLLMモデルより優れていると主張する。

▼今さら聞けないAI用語の動画説明はこちら

おすすめの記事
サムネイル

おすすめの記事

スイスのAI

今さら聞けないAI用語

このコンテンツが公開されたのは、 人工知能(AI)に関連する用語は巷にあふれている。それらは何を意味するのか? 自然言語処理(NLP)や大規模言語モデル(LLM)といったよく聞く用語について、短い動画で説明する。

もっと読む 今さら聞けないAI用語

(3)他のAIモデルより倫理的で透明性が高い →正しい

アペルトゥスは、2024年に施行された欧州AI規制法の主要要件(透明性、データ追跡性、知的財産権・プライバシーの尊重など)を遵守するように設計・開発された初の大規模AIモデルだ。モデルの構造、ニューラルネットワークの重み(ニューロン間のつながりの強さに関するパラメーター値。出力に影響する)、機械学習を実施する際の条件は全て公開されている。機械学習に利用されたデータセットは全て合法的な公開情報源から収集したもので、著作権保護対象物や、学習用データへの利用を不可とするウェブサイトの情報は使っていない。

一方、巨大テック企業は長い間、何十億人ものユーザーのデータを、著作権保護の対象物も含め無断で利用してきた。こうしたデータの取り込み作業の多くは発展途上国の隠れた低賃金労働で担われている外部リンクとエル・ムハンディ氏は指摘する。「現代の主要なAIサプライチェーンで常態化している搾取の実態はまだ把握しきれていない」

そのためアペルトゥスは特に、倫理的で法規制を遵守したAIアプリケーションを開発したい企業、研究機関、公的団体にとって価値が高い。「私たちは、他者の知的財産を盗用しない責任ある生成AI学習が可能だという実例を示した」とシュラーク氏は言う。

(4)1800種類以上の言語を話す →誤解を与える

多様な言語を包括する点もアペルトゥスの特徴だ。開発者によれば、その数は1800種類を超え、スイスで話されているロマンシュ語やスイスドイツ語など、一般的なLLMでは無視されがちな希少言語や方言も搭載されている。アペルトゥスのこうした取り組みは、多くのAIモデルが広く話されている言語に主に焦点をあてるなか、特筆に値する。

だが言語が搭載されていることと、それを正しく出力することとは別だ。特に希少言語の場合、アペルトゥスは明らかな間違いを出力することがある。

例えばスイスインフォが行った調査によれば、イタリア語の場合、アペルトゥスはときどき不自然な表現や間違った文章を出力する。ロマンシュ語では「祖父」の意味の単語を誤訳した。

シュラーク氏は、アペルトゥスの言語能力には改善の余地があるが、例えばドイツ語・ロマンシュ語間の翻訳などの特定のタスクでは、既に他のLLMモデルよりも優れている外部リンクとした。

だがこの主張に誰もが納得しているわけではない。スイス南西部ローザンヌのAI技術系新興企業ジョット・エーアイ(Giotto.ai)の最高経営責任者(CEO)、アルド・ポデスタ氏は「平均的な性能が他の同等モデルよりもはるかに劣り、最高レベルのモデルとは比較にもならないものが、ロマンシュ語を話せるからといって何の意味があるのか?」と疑問を投げかける。同氏はアペルトゥスの取り組みを支持しているが、その限界についても認識している。

EPFL・知的グローバル保健・人道支援技術研究所のマリー・アン・ハートレー所長はこの見解に対し「広く話されていない言語を話す人々も技術の対象とすべきであり、まさにアペルトゥスはそれに取り組んでいる」と異議を唱える。こうした初期の欠陥は開発者にとって、より包括的で倫理的な取り組みを推進する上での一時的な代償に過ぎない。

(5)スイス専用LLMだ →誤り

アペルトゥスはスイスの国立機関が開発したものだからスイス国内のアプリケーションにのみ有用だと考えるのは間違いだ。スイス特有の言語(スイスドイツ語とロマンシュ語)を含むこととスイス建国時(1291年)に制定された法律「同盟誓約書(The Federal Chapter of 1291)」を統合していることを除いて、アペルトゥスは主に国際的な情報源から収集されたデータセットで構築されているからだ。同盟誓約書にはAIが遵守すべき中立性や言語の多様性などの原則が定められている。シュラーク氏は「これらの点を除けば、私たちのLLMモデルにスイスに特化した要素はない」と説明する。

アペルトゥス開発チームは、他の国々がこのプロジェクトに関心を持ち、インフラ、人材、リソースの提供などで開発を支援してくれることを期待している。「私たちの目標は、アペルトゥスを欧州、さらには世界規模で発展させ続けることだ」とCSCSのジュフレーダ氏は話す。

(6)インターネットに接続されていないからリアルタイムで自己更新できない →誤解を与える

どのLLMもリアルタイムでの自己更新は不可能だ。ChatGPTのようにインターネットを介してアクセスできる製品に組み込まれていても、一度学習を終えた後はモデルの中身は変更されない。変更や修正を加える唯一の方法は再学習させることだ。だがこれには非常に膨大なコストがかかるため、頻繁に実施できるのは豊富なリソースを持つ企業に限られる。「それがこの技術の主たる限界点だ」とシュラーク氏は言う。

アペルトゥスの次回の学習は、スイス連邦政府からの2000万フラン(約38億円)の資金により、今回と同様にCSCSのスパコンAlpsで実施する予定だ。Alpsの電力は全て水力発電で賄われ、省資源にも配慮している。だが開発・運用の長期的な継続には新たな資金源の開拓が必須だ。シュラーク氏は「私たちのデジタル主権にとって極めて重要なこの技術への投資が拡大することを願っている」と語る。

編集:Gabe Bullard、英語からの翻訳:佐藤寛子、校正:大野瑠衣子

おすすめの記事

10言語で意見交換
担当: Ibrahim Sara

人工知能は人間社会の役に立つ?それとも脅威?

人間の代わりに人工知能(AI)に意思決定をさせるべきなのでしょうか?どんどん有能になっていくコンピューターは人々の生活を楽にしてくれるのか、それとも社会の脅威になるのでしょうか?

5 件のいいね!
72 件のコメント
議論を表示する

人気の記事

世界の読者と意見交換

swissinfo.chの記者との意見交換は、こちらからアクセスしてください。

他のトピックを議論したい、あるいは記事の誤記に関しては、japanese@swissinfo.ch までご連絡ください。

SWI swissinfo.ch スイス公共放送協会の国際部

SWI swissinfo.ch スイス公共放送協会の国際部