README_ja.md 9.3 KB

MCP ベースのチャットボット

(日本語 | 中文 | English

動画

👉 人間:AIにカメラを装着 vs AI:その場で飼い主が3日間髪を洗っていないことを発見【bilibili】

👉 手作りでAIガールフレンドを作る、初心者入門チュートリアル【bilibili】

イントロダクション

これはエビ兄さんがオープンソースで公開しているESP32プロジェクトで、MITライセンスのもと、誰でも無料で、商用利用も可能です。

このプロジェクトを通じて、AIハードウェア開発を理解し、急速に進化する大規模言語モデルを実際のハードウェアデバイスに応用できるようになることを目指しています。

ご意見やご提案があれば、いつでもIssueを提出するか、QQグループ:1011329060 にご参加ください。

MCPであらゆるものを制御

シャオジーAIチャットボットは音声インタラクションの入口として、Qwen / DeepSeekなどの大規模モデルのAI能力を活用し、MCPプロトコルを通じてマルチエンド制御を実現します。

MCPであらゆるものを制御

実装済み機能

  • Wi-Fi / ML307 Cat.1 4G
  • オフライン音声ウェイクアップ ESP-SR
  • 2種類の通信プロトコルに対応(Websocket または MQTT+UDP)
  • OPUSオーディオコーデックを採用
  • ストリーミングASR + LLM + TTSアーキテクチャに基づく音声インタラクション
  • 話者認識、現在話している人を識別 3D Speaker
  • OLED / LCDディスプレイ、表情表示対応
  • バッテリー表示と電源管理
  • 多言語対応(中国語、英語、日本語)
  • ESP32-C3、ESP32-S3、ESP32-P4チッププラットフォーム対応
  • デバイス側MCPによるデバイス制御(音量・明るさ調整、アクション制御など)
  • クラウド側MCPで大規模モデル能力を拡張(スマートホーム制御、PCデスクトップ操作、知識検索、メール送受信など)

ハードウェア

ブレッドボード手作り実践

Feishuドキュメントチュートリアルをご覧ください:

👉 「シャオジーAIチャットボット百科事典」

ブレッドボードのデモ:

ブレッドボードデモ

70種類以上のオープンソースハードウェアに対応(一部のみ表示)

ソフトウェア

ファームウェア書き込み

初心者の方は、まず開発環境を構築せずに書き込み可能なファームウェアを使用することをおすすめします。

ファームウェアはデフォルトで公式 xiaozhi.me サーバーに接続します。個人ユーザーはアカウント登録でQwenリアルタイムモデルを無料で利用できます。

👉 初心者向けファームウェア書き込みガイド

開発環境

  • Cursor または VSCode
  • ESP-IDFプラグインをインストールし、SDKバージョン5.4以上を選択
  • LinuxはWindowsよりも優れており、コンパイルが速く、ドライバの問題も少ない
  • 本プロジェクトはGoogle C++コードスタイルを採用、コード提出時は準拠を確認してください

開発者ドキュメント

大規模モデル設定

すでにシャオジーAIチャットボットデバイスをお持ちで、公式サーバーに接続済みの場合は、xiaozhi.me コンソールで設定できます。

👉 バックエンド操作ビデオチュートリアル(旧インターフェース)

関連オープンソースプロジェクト

個人PCでサーバーをデプロイする場合は、以下のオープンソースプロジェクトを参照してください:

シャオジー通信プロトコルを利用した他のクライアントプロジェクト:

スター履歴

Star History Chart