株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局 podcast 20250731


Listen Later

関連リンク
  • Deep Agents
  • この記事では、大規模言語モデル(LLM)を使った「エージェント」が、より複雑なタスクをこなすための工夫、通称「Deep Agent(ディープエージェント)」について解説しています。

    LLMを使ったエージェントは、まるで人間の秘書のように、私たちが指示したことを理解し、ツールを使って実行するプログラムです。しかし、一般的なエージェントは、シンプルな指示は得意でも、いくつかのツールを組み合わせたり、長い時間をかけて取り組むような複雑なタスクになると、途中で迷ったり、うまく計画を立てられなかったりする「浅い(シャロー)」という課題がありました。

    「Deep Agent」は、この課題を解決し、まるで専門家のように一つのテーマを深く掘り下げたり、複雑なタスクを長い期間にわたって計画・実行できるようになったエージェントのことです。具体的には、「Deep Research」や「Claude Code」といった成功事例から、次の4つの重要な要素が共通して使われていることが分かってきました。

    1. 詳細なシステムプロンプト:

      エージェントに「あなたはどういう役割で、何ができるのか、どんなツールをどう使うべきか」を、最初から非常に細かく、具体的な例を交えながら教え込むことで、エージェントはより賢く、的確に行動できるようになります。人間でいう「丁寧なマニュアルと研修」のようなものです。

    2. 計画ツール:

      エージェントが次に何をすべきかを計画し、その計画に沿って作業を進めるためのツールです。たとえば、「ToDoリスト」のように、実際には何も実行しないけれど、エージェントが「これからこのタスクをやるんだな」と意識し、計画を見失わないようにするための「思考整理術」のような役割を果たします。これにより、複雑なタスクでも計画的に進められます。

    3. サブエージェント:

      大きなタスクを小さなタスクに分割し、それぞれの小さなタスクを専門に担当する「子エージェント」を動かす仕組みです。まるで会社で大きなプロジェクトを部署ごとに分担するのと同じように、専門のサブエージェントが自分の担当する部分に集中して深く掘り下げることで、全体のタスクがより効率的かつ高品質に実行できるようになります。

    4. ファイルシステム:

      エージェントが作業中に得た情報や、途中のメモを書き残したり、他のエージェントと共有したりするための「仮想的なファイル置き場」です。長期にわたる複雑なタスクでは、多くの情報を記憶しておく必要がありますが、このファイルシステムを使うことで、エージェントは必要な情報を忘れずに参照したり、複数のエージェントが共同作業する際の共有スペースとして活用できます。

      これらのDeep Agentの仕組みを、誰もが自分の目的で簡単に作れるように、オープンソースのライブラリ「deepagents」が開発されました。このライブラリを使えば、上記で説明した4つの要素を組み込んだエージェントを、手軽に構築・カスタマイズできるようになります。

      引用元: https://blog.langchain.com/deep-agents/

      • 2025年夏 AIエージェントシステムに対する考え方
      • AIエージェントは、単なる賢いチャットボットの延長ではなく、「目的を持ち、意図的に行動し、経験から学習する」自律的な存在です。これは、自然言語がプログラミング言語となる「Software 3.0」の時代を象徴し、従来の予測可能なソフトウェアとは根本的に異なります。エージェントは大規模言語モデル(LLM)を基盤とし、環境認識、推論、行動実行のサイクルを自律的に回します。

        その能力は多岐にわたり、メール返信の下書きや請求書処理、システム監視などを非同期的にこなし、人間は戦略的・創造的な仕事に集中できるようになります。また、技術仕様書のような大規模文書から必要な情報を抽出し、サンプルコードの動作検証まで行えます。人間の自然な言葉や、画像とテキストを組み合わせた情報(エラー画面の分析、システム構成図からのボトルネック特定など)も理解し、具体的な解決策を提案します。

        エージェントの自律的な「観察→判断→実行」サイクルは効率的ですが、行動の結果に対する責任の所在という課題も生じます。これに対し、記事では「監督された自律性(Supervised Autonomy)」というアプローチを提唱しています。これは、タスクの重要度に応じてエージェントの自律レベル(完全自動、通知付き自動、承認後実行、支援モード)を変え、決定内容の記録や人間の承認プロセスを明確にすることで、最終的な責任は人間が持つという考え方です。

        エージェントの「ブラックボックス」化を防ぎ、信頼性を高めるためには「透明性」が不可欠です。プロセス、意図、限界の3つのレベルでエージェントの思考や判断根拠を人間が理解できるようにするべきです。例えば、「Chain of Thought(思考の連鎖)」で推論過程を段階的に示したり、判断の確信度や限界を正直に伝えたりすることが挙げられます。

        エージェントの性能を最大限に引き出す鍵は「コンテキストエンジニアリング」です。これは、エージェントにその時々で必要な情報とツールを最適なタイミングで提供し続ける技術であり、「デジタル世界の建築学」とも表現されます。情報を記録(Write)、動的に取得(Select)、要約(Compress)、タスクごとに分離(Isolate)する戦略を通じて、エージェントが適切な文脈で効率的に機能するように設計します。

        さらに複雑なタスクには、複数のエージェントが協力する「マルチエージェントシステム」が有効です。Claudeの「Sub Agent」のように、各エージェントが特定の専門分野に特化し、互いに必要な情報を共有・連携することで、単一エージェントでは難しい高度な問題解決や、予期せぬ「創発的」な成果を生み出す可能性を秘めています。将来的な概念として、エージェントたちが議論し合意形成する「サンガ(Sangha)」のような民主的意思決定機構も構想されています。

        AIエージェントの進化は、人間の役割を「計算者」から「創造者」へと変える「共進化」をもたらします。人間は、ルーチンワークから解放され、エージェントへの「意図の設計」、倫理的な「判断」、そして「創造的な探索」に集中するようになります。私たちは、エージェントを道具として使いながら、共に成長していく新しい時代の入り口に立っています。

        引用元: https://syu-m-5151.hatenablog.com/entry/2025/07/29/195608

        • Qwen/Qwen3-30B-A3B-Instruct-2507 · Hugging Face
        • 大規模言語モデル(LLM)の「Qwen」シリーズから、新たに「Qwen3-30B-A3B-Instruct-2507」が発表されました。これは、Qwen3-30B-A3Bの改良版で、「非思考モード」に特化しているのが特徴です。つまり、従来のモデルのように思考の過程を示す特別なブロック(など)を生成せず、直接結果を出力するようになり、よりシンプルに利用できるようになりました。

          この新しいモデルの主な強化点は以下の通りです。

          1. 汎用的な能力の大幅向上: 命令の理解、論理的な推論、テキストの読み込み、数学の問題解決、科学的な知識、プログラミング、そしてツールの利用能力が大きく改善されました。
          2. 幅広い知識のカバー: さまざまな言語における、より広範で深い知識に対応できるようになりました。
          3. ユーザー志向の応答: ユーザーの好みや意図をより正確に捉え、主観的な質問や自由形式のタスク(例えば、作文など)に対して、より役立つ、高品質なテキストを生成できるようになりました。
          4. 長文理解能力の強化: 256K(約26万)トークンという非常に長い文章や文脈を一度に理解し、処理する能力が向上しました。これは、長文のドキュメント要約や複雑なコードの理解などに役立ちます。
          5. 技術的な側面としては、総パラメータ数が305億あり、そのうち約33億がアクティベートされる(Mixture-of-Experts: MoEという効率的な構造を持つ)モデルです。ネイティブで262,144トークンという長いコンテキスト長をサポートしており、これにより非常に長い入力にも対応できます。

            ベンチマークテストでは、知識、推論、コーディング、ユーザーとの適合性、エージェント機能、多言語対応といった多くの分野で、従来のQwen3-30B-A3Bから大幅な性能向上が見られ、他の主要なLLMモデルとも競争力のある結果を出しています。

            このモデルは、Hugging Faceのtransformersライブラリの最新バージョンで簡単に利用でき、SGLangやvLLMといったツールを使えば、OpenAI互換のAPIとしてデプロイすることも可能です。また、OllamaやLMStudioといったローカル実行環境でもサポートされており、プログラミングの経験が浅い新人エンジニアでも、様々な用途でLLMの強力な能力を試すことができるでしょう。

            引用元: https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507

            • ニコニコ生放送iOS版アプリ「AIボイスチェンジャー」β版を無料提供開始 - Mogura VR
            • ニコニコ生放送のiOSアプリで、AIを使ったボイスチェンジャー機能が無料で使えるようになりました。これはドワンゴ独自のAI技術で、あなたの声をリアルタイムに「ずんだもん」など100種類以上のキャラクターボイスに変換できます。iPhoneやiPadがあればすぐに使え、声を出さずに配信したい方やVTuber活動を始めたい方に便利です。この技術を配信アプリに導入したのは業界初の試みで、リリース記念のキャンペーンも開催中です。

              引用元: https://www.moguravr.com/niconico-live-app-ai-voicechanger-beta/

              • お便り投稿フォーム
              • (株式会社ずんだもんは架空の登場組織です)

                ...more
                View all episodesView all episodes
                Download on the App Store

                株式会社ずんだもん技術室AI放送局By 株式会社ずんだもん技術室AI放送局