AI で稼ぐ方法を一緒に考えていくブログ。

自己紹介はこちら →

ニュース解説

Rio製LLMの“自前開発”疑惑 — 個人開発者がモデルの出自を見るべき理由

Rio-3.5-Open-397Bが既存モデルのマージではないかとGitHub上で指摘された。個人開発者には、無料モデルの期待と検証コストの増加が同時に来ている。

Rio製LLMの“自前開発”疑惑 — 個人開発者がモデルの出自を見るべき理由

ブラジル発の“自前LLM”として見られていたRio-3.5-Open-397Bに、既存モデルを混ぜたものではないか、という指摘が出た。発端はGitHub上のIssueで、Nex-N2_proとQwen系モデルの重みを混ぜたように見える、という内容だ。

ここで大事なのは、モデルのマージ自体が悪いわけではないこと。オープンLLM界隈では、既存モデルを混ぜて性能を調整することは普通にある。問題は、それを“homegrown”、つまり自前で作った成果のように見せていたのでは、という信頼の部分にある。

個人でAIツールや小さなプロダクトを作っている側から見ると、これは単なる海外炎上では済まない。無料で強いモデルを使えるのは助かる一方で、モデルカードやライセンス、出自の確認まで自分で見る必要が出てくる。そこが今回の嫌なところだ。

  • 一次ソース: https://github.com/nex-agi/Nex-N2/issues/4

この記事をわかりやすく

この記事をわかりやすく

Rio-3.5-Open-397B (= Rio側が公開した大規模言語モデル) が、本当にゼロから作られたモデルなのか疑われている。GitHub Issue (= GitHub上でバグ報告や議論をする場所) では、このモデルがNex-N2_pro (= Nex AGIが公開している既存の高性能オープンモデル) とQwen (= Alibaba系のオープンLLM群) を混ぜたものにかなり近い、という指摘が出た。

数字としては、反応サマリ上では「約0.6 Nex-N2 + 0.4 Qwen」と見られている。つまり6:4くらいで既存モデルを混ぜた可能性がある、という話だ。context 262k (= 一度に読める文章量がかなり大きい設定) などの性能面より、今回は“誰の成果として出したのか”が焦点になっている。

表向きのトーンは、ブラジル発の自前AI開発という国産・独自開発の大義名分。具体的にやっていることとして疑われているのは、weight merge (= 複数モデルの重みを混ぜて別モデルにする手法) に近いモデル公開だ。マージは普通に有用だが、クレジットなしで“自作”に見せると話が変わる。

個人にとっての意味: 自分の動きにどう効くか

個人にとっての意味: 自分の動きにどう効くか

Claude Code Maxユーザー目線だと、直接このRioモデルを使う場面は少ないかもしれない。ただ、Claude CodeやCursorで作ったものに別のオープンモデルを組み込む時、モデルの出自確認が雑だとクライアントワークで説明できなくなる。自分はここが一番気になった。サブスク系ツールだけで閉じている間は楽だが、自己ホストやAPI置き換えを考えた瞬間に面倒が増える。

個人builder目線では、これはリスクと機会が同時にある。Nex-N2-Pro自体はApache 2.0 (= 商用利用もしやすいオープンソースライセンス) のMoE (= 必要な部分だけ動かすモデル構造) として注目されていて、17B active (= 実際に推論時に動く規模が約170億パラメータ) や262k contextはかなり魅力がある。長いログや作業履歴を扱うエージェントには普通に使ってみたい。

ノーコード系AI副業狙い目線では、正直これは様子見でいい。LovableやBoltでアプリを作る段階なら、モデルの重みの系譜まで追うより、まず売れる小さい用途を作る方が先。ただし「無料LLMで安く作れます」と人に売るなら、ライセンスとモデルカードは最低限見る必要がある。

個人開発者の反応では、「Rio側は当初homegrownとして見せていたが、GitHub Issueで約0.6 Nex-N2 + 0.4 Qwenのマージらしいと出てからカードを更新して謝罪した」という不満が出ていた。これはかなり嫌なパターンで、間違ったファイルを上げなければ見つからなかったのでは、という疑念が残る。

もう一つ、「新しいオープンモデルを自己ホストや顧客案件で使う前に、weight lineage (= モデル重みの由来) とmodel card (= モデルの説明書) の確認が必須になった」という反応もあった。自分の実感に近いのは罠の方だ。無料で強いモデルほど、採用前の確認コストを見落としやすい。

明日からのアクション: これを糧にするには

明日からのアクション: これを糧にするには

  • すぐやる 今週中に、使いたいオープンモデルを1つ選び、Hugging Faceのmodel cardとGitHub Issueを30分だけ読む。費用は$0。Nex-N2-ProやQwen系のように商用利用が絡むものから見る。
  • すぐやる 今日中に、自分のメモに「モデル名、ライセンス、出自、用途、確認日」の5項目テンプレを作る。NotionでもGoogle Sheetsでもいい。費用は$0で足りる。
  • 検討 2週間以内に、Nex-N2-Proをローカルまたは安いGPUレンタルで短時間だけ試す。RunPodなどを使うなら、まず$5から$10の範囲で止める。長文処理やツール呼び出しが自分の用途に合うかだけ見る。
  • 検討 Claude Code、Cursor、Lovable、Boltで作っている小さな案件に、オープンモデル置き換えの余地があるか月末までに1件だけ洗い出す。いきなり全面移行せず、API代の比較を$0、$20、$200の3段で見る。
  • 保留判断 Rio-3.5-Open-397Bのように出自で揉めているモデルは、少なくともカード更新後1週間は顧客案件に入れない。費用は$0だが、信用コストが高い。個人の実験用に留める。
  • 罠の回避 「国産」「homegrown」「新世代」といった言葉だけで採用しない。今月から、商用利用前にライセンスとIssueを15分確認するルールを入れる。確認できないモデルは無料でも使わない。
  • 検討 逆張りの機会として、モデル選定代行や“安全に使えるオープンLLM一覧”の小さな日本語コンテンツを来月までに作る。初期費用は$0からでよく、ノーコードで1ページにまとめるだけでも、出自確認が面倒な人には刺さる可能性がある。

今回の件で、オープンモデルを使うハードルが下がった一方、見るべき場所は増えた。個人にとっては面倒だが、ここを丁寧に見る人はまだ少ない。無料モデルをただ追うより、信用できる使い方まで含めて整理する方が、仕事にはつながりやすい。