株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局 podcast 20250130


Listen Later

関連リンク
  • Open-R1: a fully open reproduction of DeepSeek-R1
  • DeepSeek-R1は、推論能力に特化した大規模言語モデルで、特に数学、コーディング、論理の問題解決に優れています。このモデルは、DeepSeek-V3という高性能な基盤モデルをベースに、強化学習(RL)を用いて訓練されています。DeepSeek-R1の特筆すべき点は、人間の監督なしで推論能力を向上させた点で、これは、問題解決のステップ分解や出力の自己検証など、高度な推論スキルの開発に繋がっています。

    しかし、DeepSeek-R1の学習データや訓練コードは公開されていません。そこで、Hugging FaceはOpen-R1プロジェクトを開始し、DeepSeek-R1のデータと訓練パイプラインを再現し、オープンソースコミュニティに共有することを目指しています。
    具体的には、以下の3つのステップで進めます。

    1. DeepSeek-R1から高品質な推論データセットを抽出し、R1-Distillモデルを再現します。
    2. DeepSeekがR1-Zeroを作成するために使用した純粋なRLパイプラインを再現します。
    3. ベースモデルからSFT(教師あり微調整)、RLへと段階的に訓練できることを示します。
    4. このプロジェクトを通じて、推論モデルの訓練に関する透明性を高め、再現可能な知見を共有し、将来のモデル開発のための基盤を構築することを目指します。
      Open-R1プロジェクトは、コードの貢献や議論への参加を歓迎しており、コミュニティ全体でこの目標を達成することを目指しています。

      引用元: https://huggingface.co/blog/open-r1

      • Introducing the LangGraph Functional API
      • LangGraphのFunctional APIがリリースされました。このAPIは、グラフ構造を明示的に定義せずに、ヒューマンインザループ、永続化/メモリ、ストリーミングといったLangGraphの主要機能を活用できる点が特徴です。

        主な構成要素として、ワークフローの開始点となるentrypointと、個別の作業単位であるtaskの2つのデコレータが提供されており、これらを用いて標準的な関数でワークフローを定義できます。
        Functional APIは、既存のアプリケーションにLangGraphの機能を組み込みやすく、コードを大幅に書き換える必要がありません。また、Graph API(StateGraph)と組み合わせて使用することも可能です。

        主な機能として、以下のものがあります。

        • ヒューマンインザループ: ユーザーのレビューや承認をワークフローに組み込むことができ、interrupt関数でワークフローを一時停止し、ユーザーの入力を待つことができます。
        • 短期メモリ: 会話履歴を保持し、直前の状態をpreviousパラメータで取得できます。また、entrypoint.final()を使って、次のチェックポイントのために異なる値を保存できます。
        • 長期メモリ: storeパラメータを使って、ユーザーの情報を永続的に保存し、複数の会話にわたって情報を共有できます。
        • ストリーミング: ワークフローの進捗状況、LLMのトークン、カスタムデータをリアルタイムでストリーム配信できます。
        • さらに、LangSmithとの連携により、ワークフローの監視やデバッグも可能です。Functional APIは、Graph APIと比較して、制御フローの記述が簡単で、状態管理が不要な点がメリットです。

          ただし、Graph APIの方がより詳細なチェックポイント管理や可視化機能が優れています。両APIは同じランタイムを使用しているため、プロジェクト内で組み合わせて使用することも可能です。

          引用元: https://blog.langchain.dev/introducing-the-langgraph-functional-api/

          • 農協で農家さんが「デンドロビウム買ったんだ~」と言っていて危うくガノタだと勘違いするところだった
          • 農協での会話で、農家の方が「デンドロビウムを買った」と言ったことから、投稿者はガンダム好きかと勘違いしました。デンドロビウムは、ガンダムシリーズに登場するモビルスーツの名前であると同時に、実際には植物の名前でもあります。このやり取りから、他のユーザーもガンダム関連の連想をしたことや、花の名前がガンダムの機体名に使われていることなどが話題になりました。また、実際にデンドロビウムを育てている人のコメントや、他の花の名前を持つガンダム機体の情報も共有されています。この一件は、日常の何気ない会話から、ガンダムという共通の話題で盛り上がれる面白さを感じさせる出来事でした。

            引用元: https://togetter.com/li/2503535

            • お便り投稿フォーム
            • (株式会社ずんだもんは架空の登場組織です)

              ...more
              View all episodesView all episodes
              Download on the App Store

              株式会社ずんだもん技術室AI放送局By 株式会社ずんだもん技術室AI放送局