1Xがワールドモデルに賭ける理由。家庭用ヒューマノイドNEOは「家事ロボット」ではなく、フィジカルAIのデータ端末なのか

1Xがワールドモデルに賭ける理由。家庭用ヒューマノイドNEOは「家事ロボット」ではなく、フィジカルAIのデータ端末なのか

ノルウェー発のロボット企業1Xが、ワールドモデル専門の研究組織「1X World Model Lab」を設立しました。同社は家庭用ヒューマノイドNEOを発表し、2026年から米国を中心に出荷を始める計画です。ただし、この動きは単に「家事を手伝うロボットが登場する」という話だけではありません。1Xが本当に狙っているのは、家庭という複雑な現場から実世界データを集め、そのデータを使って次世代のロボットAIを育てる仕組みです。本稿では、1Xのワールドモデル戦略を読み解きながら、フィジカルAI時代に企業が見るべき競争軸を整理します。

株式会社ロボットワークスでは、中国ロボット企業、フィジカルAI企業、AIハードウェア企業に関するリサーチ、現地視察、企業訪問、導入前調査、日本市場展開支援を行っています。海外ロボット企業の発表を単なるニュースとして読むのではなく、日本企業の提携、調達、PoC、事業開発に使える判断材料として整理することを重視しています。

目次

この記事でわかること

読む前の全体像 1X / NEO / World Model / Data Loop World ModelNEOData LoopJapan 株式会社ロボットワークス作成
  • 1X World Model Lab設立が示す、フィジカルAI開発の新しい競争軸
  • 家庭用ヒューマノイドNEOを「家事ロボット」だけでなく実世界データ端末として見る理由
  • ワールドモデル、VLA、実世界データ、垂直統合の関係
  • 日本企業が海外ロボット企業を評価する際に確認すべきポイント

1Xが設立したWorld Model Labとは何か

World Model Lab 現実世界を予測するロボットAI研究 映像理解物理予測行動計画 株式会社ロボットワークス作成

1Xは2026年6月4日、ワールドモデルに特化した研究組織「1X World Model Lab」の設立を発表しました。ワールドモデルとは、AIが現実世界の構造、物体の動き、空間関係、物理的な因果関係を内部的に学習し、将来の状態や行動結果を予測するためのモデルです。ロボットにとっては、行動前に「この動きをしたら何が起きるか」を予測するための頭の中のシミュレーターに近い存在です。

今回1Xが迎えたSam Sinha氏は、Luma AIで動画生成モデルに関わってきた研究者です。Luma AIは動画生成AI領域で知られる企業であり、同氏の経験は、映像から物理世界の構造を学習するワールドモデル開発と相性が良いと考えられます。1Xが目指しているのは、ロボットが特定タスクだけを覚える状態から、未知の環境でも行動を組み立てられる状態へ進むことです。

ここで1Xが強調しているのは、「ロボットはファインチューニングの問題ではない」という考え方です。従来のAI開発では、大量のテキストや画像、動画で基盤モデルを作り、最後に特定領域のデータで調整する流れがよく使われてきました。しかし、家庭や工場で動くロボットの場合、この方法だけでは足りません。ロボットが必要とするのは、画面の中の知識ではなく、実際に物体に触れたときの重さ、摩擦、滑り、力の入り方、関節の状態といった身体を持つAIならではの情報だからです。

1Xの主張を日本企業向けに言い換えるなら、「ロボットにとって一番価値のあるデータを、最後の調整段階で少し見せるだけでは、自律的に動ける機械は作れない」ということです。ロボットが扱うべきデータは、最初から学習の中心に置く必要があります。

1XWMから見える、1Xの技術思想

未来を想像して動く Future Video -> Inverse Dynamics -> Action VLA直接行動World Model未来から逆算 株式会社ロボットワークス作成

1Xは2026年1月に、1XWMと呼ばれるワールドモデルを公開しています。これは、動画生成モデルをベースにロボットの行動を組み立てる仕組みです。

一般的なVLA、つまりVision-Language-Actionモデルは、視覚情報と言語指示を受け取り、それをロボットの行動に変換します。たとえば「机の上のカップを取って」と指示されたとき、画像と言葉を読み取り、ロボットの腕や手をどう動かすかを出力します。

一方、1XWMの発想は少し違います。まず、ロボットがこれから起こすべき未来の映像を生成します。そのうえで、現在の状態からその未来の状態へ移るにはどんな動作が必要かを逆算します。つまり、「いきなり動作を出す」のではなく、「望ましい未来を映像として想像し、その未来へ向かう動作を取り出す」という流れです。

1Xの説明によれば、1XWMは14Bパラメータの動画生成モデルを基盤とし、900時間の一人称人間動画で中間学習し、70時間のNEOロボットデータでNEOの身体に適応させています。さらに、逆動力学モデルは400時間のロボットデータで訓練されています。この構成から分かるのは、1Xがインターネット上の人間動画とロボット固有のデータを組み合わせようとしていることです。

以前の1XWMでは、ロボットデータはNEOという身体に合わせるための調整に近い位置づけでした。しかし、今回のWorld Model Lab設立で見えてきたのは、1Xがさらに踏み込んで、ロボットデータそのものを事前学習の初期段階から組み込もうとしている点です。ここに、同社の認識の変化があります。

動画を見て物体の動きを理解するだけなら、現在の動画生成AIでも一定の能力を持ちます。しかし、ロボットが実際に皿を持ち上げる、布を畳む、ドアを開ける、ケーブルを避けるといった行動をするには、映像だけでは足りません。掴む力が少し弱ければ物体は落ち、強すぎれば壊れます。カメラに映る情報だけでは、接触した瞬間の力や滑りを完全には捉えられません。

だからこそ、1Xは映像だけでなく、関節の状態、力覚、手の圧力、全身の張力、ロボット自身が実際に動いた結果を含むデータを重視していると考えられます。ワールドモデルは未来映像を作る技術ではありますが、フィジカルAIの文脈では「物理的に正しい未来」を予測できるかが問われます。

NEOは家庭用ロボットである前に、実世界データを集める端末である

NEO = Data Terminal 家庭の例外が学習データになる 家庭NEOData改善 株式会社ロボットワークス作成

1XのNEOは、家庭向けヒューマノイドとして発表されています。公式情報では、Early Access価格は2万ドル、将来的なサブスクリプションは月額499ドルとされています。重量は66ポンド、約29.94kg。手は22自由度で、22dBの静音性を備え、家庭内での利用を想定した柔らかい外装を採用しています。

表面的には、これは家事を手伝う家庭用ロボットです。服を畳む、棚を整理する、物を取る、照明を消す、会話をする。こうした機能は、消費者向け製品として分かりやすい訴求になります。

しかし、1Xの戦略を深く見ると、NEOは単なる家事ロボットではありません。家庭という最も複雑な現場から、ロボットにとって価値の高いデータを集める端末として設計されていると見るべきです。

家庭は、ロボットにとって難しい環境です。工場であれば、作業台の位置、部品の形状、照明、作業手順を一定にできます。物流倉庫でも、棚や通路、荷物の規格はある程度管理できます。しかし家庭では、椅子の位置、床に置かれた物、食器の形、照明、ペット、子ども、人間の生活習慣が日々変わります。ロボットにとっては、例外だらけの環境です。

その家庭でNEOが動くと、実世界の多様なデータが蓄積されます。どのような物体がどこに置かれ、どのように掴まれ、失敗したときに何が起き、遠隔操作や人間の補助によってどのように修正されたのか。このデータは、単なる動画データよりもロボットAIにとって価値があります。

ソフトウェアの世界では、ユーザーが実際に使うことでプロダクトが改善され、利用データが次のモデル改善につながる構造があります。1Xは、それに近いことを物理世界でやろうとしています。NEOを家庭に出し、実際の利用からデータを集め、ワールドモデルを改善し、改善されたモデルを再びNEOに戻す。この循環が回れば、同社は家庭内ロボットの実データを持つ企業になります。

なぜNEOは人間に近い身体を持つ必要があるのか

人間に近い身体 動画データを行動へ移しやすくする設計 Human VideoEmbodiment GapNEO Body 株式会社ロボットワークス作成

NEOの身体設計も、データ戦略とつながっています。

1XはNEOに腱駆動を採用しています。腱駆動とは、人間の腱のように張力で関節を動かす方式です。一般的なヒューマノイドでは、モーター、ギア、減速機を組み合わせて関節を動かす構造が多く使われます。これに対し、腱駆動は柔らかさや軽量性を出しやすい一方で、制御や耐久性、張力管理の難しさがあります。

1Xがこの方式を選んでいる理由は、安全性だけではないと考えられます。もちろん、家庭で人間の近くを動くロボットであれば、軽量で柔らかいことは大きな意味を持ちます。29.94kgのNEOと、60〜90kg級の硬いヒューマノイドでは、転倒時や接触時のリスクが違います。

ただし、より深い理由は、ロボットが人間に近い身体を持つことで、人間の作業動画を学習データとして使いやすくなる点です。世界中には、人間が料理をする、棚を整理する、ドアを開ける、服を畳む、工具を使う動画が大量にあります。ロボットの身体が人間の身体とあまりにも違えば、これらの動画から得た知識をそのまま行動に移すことはできません。

この問題は、エンボディメントギャップ、つまり身体差の問題として説明できます。人間の腕、手、関節、視点と、ロボットのそれが異なれば、同じ映像を見ても実行できる動作は変わります。NEOが22自由度の手を持ち、柔らかい身体を持ち、人間に近い形をしているのは、単に見た目を親しみやすくするためだけではありません。人間の動画データをロボットの学習に転用しやすくするための設計でもあります。

ここから、ロボット開発の見方が変わります。従来は、ハードウェアの価値を「どれだけ重い物を持てるか」「どれだけ速く動けるか」「何自由度あるか」で判断しがちでした。これからは、「どのようなデータを活かせる身体か」「現場で安全に試行錯誤できる身体か」「人間の行動データをどれだけ使える設計か」も評価軸になります。

垂直統合は、製造戦略であり、データ戦略でもある

Vertical Integration AIと身体を同じ速度で改善する HardwareSensorsAI ModelFactoryAI x Hardware 株式会社ロボットワークス作成

1Xはカリフォルニア州HaywardにNEO Factoryを設けています。公式発表では、同工場は58,000平方フィート、200人以上のチームで運営され、NEOのフルスケール生産を開始しています。また、1Xはモーター、バッテリー、構造部品、伝達機構、センサーなど重要部品を自社で設計・製造すると説明しています。

この垂直統合は、単なる製造コスト削減の話ではありません。AIとハードウェアを同じ速度で改善するための仕組みです。

ロボットAIの性能は、データの質に左右されます。データの質は、センサー、手、関節、駆動方式、カメラ位置、力覚の精度に左右されます。もしAIチームが「手の圧力データが粗く、掴む力の学習が進まない」と気づいた場合、外部サプライヤーに依存していると改善に時間がかかります。しかし、ハードウェアとAIが同じ会社内で動いていれば、センサー設計、手の構造、データ収集方法、モデル学習を同時に変えられます。

フィジカルAIでは、AIと身体を切り離して考えることはできません。身体がどのようなデータを取れるかによって、AIが学べる範囲が決まります。逆に、AIがどのようなデータを必要としているかによって、次のハードウェア設計も変わります。

この点で、1Xの垂直統合は製造戦略であると同時に、データ戦略でもあります。NEOを大量に家庭へ届けるには製造能力が必要です。家庭から得られるデータをモデルに戻すにはAI基盤が必要です。モデル改善に合わせて身体を変えるには、ハードウェアの内製能力が必要です。これらを一つの会社で回そうとしている点に、1Xの戦略の重さがあります。

競争軸は「モデル性能」から「データ閉ループ」へ移っている

競争軸の移動 Model Performance -> Data Loop ModelDemo現場データ改善循環 株式会社ロボットワークス作成

1Xの動きを見るうえで、他社との比較も欠かせません。

NVIDIAは、自社で家庭用ヒューマノイドを売るよりも、フィジカルAIの基盤技術を提供する立場にいます。Cosmos、Isaac Sim、GR00Tのようなモデル、シミュレーション、開発環境を通じて、ロボット企業全体のインフラになろうとしています。これは、ロボットを作る企業にとっての土台を押さえる戦略です。

Physical Intelligenceは、π0系のモデルを通じて、異なるロボット本体をまたいで使える汎用ロボット基盤モデルを目指しています。自社で家庭用ロボットを大量に販売するというより、複数のロボット企業や現場にまたがるAIモデルを作る方向です。

Figure AIは、工場や物流といった比較的構造化された現場から実運用データを集めています。家庭と違い、工場は環境を管理しやすく、商業価値も出しやすい領域です。一方で、家庭ほどの多様なデータは集まりにくいという見方もできます。

Teslaは、自動運転で巨大なデータフライホイールを構築してきました。ただし、自動車の走行データと、家庭や工場で物を掴む操作データは異なります。道路を走る能力と、布を畳む、皿を洗う、引き出しを開ける能力は同じではありません。Optimusが本当の意味でロボットデータの閉ループを回せるかは、今後の実運用にかかっています。

1Xは、これらとは違う賭け方をしています。自社で身体を作り、自社で家庭に届け、自社でデータを集め、自社でワールドモデルを鍛える。この構造が回れば、他社が簡単には入手できない家庭内の実世界データを持てます。一方で、製造、保守、遠隔操作、プライバシー、安全性、ユーザーサポートまで抱えることになります。

この競争は、「どの会社のロボットが展示会で一番うまく動くか」ではありません。誰が現場からデータを集め、そのデータをモデル改善に戻し、改善したモデルを再び現場へ届ける循環を作れるかの競争です。

1Xの戦略には大きな賭けが含まれている

大きな賭け 技術・事業・運用リスクを同時に抱える 技術プライバシー遠隔支援量産 株式会社ロボットワークス作成

1Xの構想は筋が通っています。ただし、現時点で過度に楽観するべきではありません。

家庭用ヒューマノイドは、技術的にも事業的にも難しい領域です。まず、家庭内タスクは例外が多すぎます。食器の形、家具の配置、床の状態、照明、人間の生活習慣は家庭ごとに違います。工場のように標準化された作業環境を作ることはできません。

次に、遠隔操作への依存があります。NEOが初期段階でどこまで自律的に動けるのか、未知のタスクでどの程度人間の補助が必要なのかは、慎重に見る必要があります。遠隔操作はデータ収集には有効ですが、商業製品としてはコスト、プライバシー、ユーザー体験の問題を伴います。

さらに、家庭内データの取り扱いも避けられない論点です。家庭は最もプライベートな空間です。そこにカメラ、マイク、センサーを持つロボットが入り、必要に応じて遠隔支援を受ける場合、ユーザーがどこまで納得できる設計にするかが問われます。技術だけでなく、説明責任、データ管理、アクセス権限、監査の仕組みが必要になります。

また、製造面の負荷もあります。1XはNEO Factoryで年産1万台規模の生産能力を持つと説明し、2027年末までに10万台超へ拡大する計画を示しています。しかし、ヒューマノイドを量産し、家庭へ届け、保守し、ソフトウェアを更新し続けることは、スマートフォンや家電よりも複雑です。機械としての故障、転倒、部品摩耗、ユーザーごとの差異、家庭環境ごとのトラブルが発生します。

つまり、1Xは「AIモデル企業」としてだけではなく、「製造業」「サービス業」「データ企業」「家庭向けプロダクト企業」を同時にやろうとしています。これは成功すれば強い一方で、失敗した場合の負荷も大きい戦略です。

日本企業はこのニュースをどう読むべきか

日本企業の確認軸 スペック表の外側を見る データ権利遠隔操作保守安全・認証 株式会社ロボットワークス作成

日本企業がこのニュースから学ぶべきことは、1XのNEOをそのまま導入するかどうかではありません。見るべきなのは、フィジカルAI企業を評価する軸が変わり始めていることです。

第一に、完成品のスペックだけでは判断できません。重量、自由度、価格、稼働時間はもちろん重要ですが、それだけではロボット企業の本当の強さは分かりません。その企業がどのようにデータを集め、どのようにモデルを改善し、現場に戻しているのかを見る必要があります。

第二に、実世界データの質が競争力になります。ロボットにとって価値があるのは、きれいに整理されたデモ動画だけではありません。失敗、接触、滑り、力加減、例外処理、遠隔操作による修正といった泥臭いデータです。これを継続的に集められる企業は、モデル改善の材料を持つことになります。

第三に、ハードウェアとAIを分けて考えないことです。ロボットでは、身体が取れるデータを決めます。センサーの位置、手の構造、関節の柔らかさ、駆動方式、カメラの視点が、AIの学習効率に影響します。展示会で派手に動くロボットよりも、現場で使いながら学習できる構造を持つ企業の方が、長期的には強くなる可能性があります。

第四に、日本企業が中国や海外のロボット企業と連携する場合、確認すべき項目が変わります。単に価格表とスペック表を見るだけでは足りません。どの現場でデータを集めているのか。遠隔操作や人間の補助はどこまで必要なのか。データの権利は誰に帰属するのか。日本で運用した場合、保守、認証、安全管理、個人情報保護にどう対応するのか。こうした論点を最初から確認する必要があります。

1Xの事例は米国企業の話ですが、中国のフィジカルAI企業を見る際にも同じ視点が使えます。Unitree、UBTECH、智元机器人、星動紀元、Agibot、Galbot、Fourier Intelligenceなどを比較する場合も、機体スペックだけでなく、データ閉ループ、実運用現場、モデル開発体制、ハードウェア改善速度を見る必要があります。

株式会社ロボットワークスが支援できること

RobotWorks Support 調査からPoC設計まで ResearchVisitPartneringPoC海外ロボット企業の判断材料へ 株式会社ロボットワークス作成

株式会社ロボットワークスでは、中国のロボット企業、フィジカルAI企業、AIハードウェア企業に関するリサーチ、現地企業との面談調整、深センを中心とした中国現地視察のアレンジ、日本市場向けの事業開発支援を行っています。

フィジカルAI領域では、ニュースを読むだけでは実態を把握しにくい場面が増えています。各社が発表する動画やスペックは見栄えが良くても、実際の導入可能性、データ取得の仕組み、保守体制、日本市場での運用条件まで確認しなければ、事業判断には使えません。

特に、海外ロボット企業との提携、代理販売、共同開発、PoC、視察、レポート作成を検討する場合、技術トレンドだけでなく、企業の実力、商業化の段階、サプライチェーン、現地での評判、資本関係、量産体制を合わせて見る必要があります。

株式会社ロボットワークスでは、中国現地ネットワークとフィジカルAI領域の情報収集を活かし、日本企業が海外ロボット企業と向き合う際の調査、面談設計、視察設計、事業開発の整理を支援しています。

中国ロボット・フィジカルAI企業との提携、視察、リサーチ、代理販売、共同開発をご検討の企業様は、株式会社ロボットワークスまでお気軽にご相談ください。

まとめ

結論 フィジカルAIはデータ閉ループの競争へ NEOWorld ModelData Loop事業判断 株式会社ロボットワークス作成

1XのWorld Model Lab設立は、単なる研究組織の立ち上げではありません。家庭用ヒューマノイドNEOを通じて実世界データを集め、そのデータをワールドモデルの事前学習に戻し、ロボットの自律性を高めるための布石です。

NEOは家事ロボットとして販売されますが、事業戦略として見るなら、家庭という最も複雑な現場からエンボディドAIのデータを集める端末でもあります。ここに1Xの狙いがあります。

フィジカルAIの競争は、モデル単体の性能比較から、実世界データをどれだけ継続的に集め、改善に戻せるかという競争へ移っています。ロボット企業を見る際には、スペックやデモ動画だけでなく、データ閉ループ、量産体制、ハードウェアとAIの統合度、現場での学習能力を確認する必要があります。

日本企業がこの領域に向き合う際にも、表面的な技術紹介ではなく、実際にどの企業と組むべきか、どの現場で検証すべきか、どのリスクを先に確認すべきかを整理することが欠かせません。1Xの事例は、その判断軸を考えるうえで参考になるニュースです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

Makoto Yoshikawaのアバター Makoto Yoshikawa 代表取締役

株式会社ロボットワークス 代表取締役。中国・深圳と日本を拠点に、中国ロボット企業の日本市場展開支援、中国フィジカルAI・ロボティクス市場の現地リサーチ、企業訪問・視察企画、ビジネスマッチング、ロボティクス関連製品の販売支援を行う。ヒューマノイドロボット、サービスロボット、AIハードウェア、ロボット部品などの現地動向を継続的に調査し、日本企業向けに実務的な情報発信と事業開発支援を提供している。

コメント

コメントする

目次