株式会社ずんだもん技術室AI放送局

マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20251027


Listen Later

関連リンク
  • Claude Skills でエージェントに専門的なタスクを実行させる
  • Anthropic社から新たに発表された「Claude Skills」は、大規模言語モデル(LLM)であるClaudeに、特定の専門的なタスクを実行させるための強力な新機能です。新人エンジニアの皆さんも、これからのAI開発で活用できる可能性を秘めています。

    これまでのClaudeでは、単に指示を理解して文章を生成するだけでなく、スプレッドシート作成のような定型的な作業も可能でしたが、Skills機能を使うと、さらに複雑で具体的なタスクを自動でこなせるようになります。例えば、「ウェブページのスクリーンショットを撮ってPDFにまとめる」といった、複数のステップを伴う処理をClaude自身に実行させることができます。

    Skillsの大きな特徴は、Code Execution Tool(コード実行ツール)と連携している点です。これにより、JavaScriptやPythonといったプログラミング言語で書かれたコードをClaudeがサンドボックス環境で実行できるようになります。これは、通常のチャットだけでは実現できない高度な処理をAIエージェントに任せられることを意味します。

    スキルを作成する際は、SKILL.mdというMarkdownファイルが中心となります。このファイルには、スキルの名前(name)と詳細な説明(description)を記述します。特に重要なのは、Claudeがいつそのスキルを使うべきかを判断するために、nameとdescriptionがシステムプロンプトに読み込まれることです。この設計は、必要な時だけ詳細な情報を読み込むことで、AIが一度に処理できる情報量(コンテキストウィンドウ)の圧迫を防ぎ、Claudeの性能低下を防ぐ工夫がされています。もしスキルの説明が長くなる場合は、SKILL.mdの本文は簡潔にし、詳細なコード例やヘルパースクリプトは別のファイルに分けて参照することが推奨されています。

    作成したスキルは、ZIPファイルに圧縮してClaudeアプリの設定画面から簡単にアップロードできます。アップロード後、チャットで具体的なタスクを指示すると、Claudeがアップロードされたスキルの中から最適なものを選び、コードを実行して作業を進めてくれます。記事の例では、ウェブページのスクリーンショットを撮り、それらをPDFに変換するスキルを作成し、実際にClaudeにそのタスクを指示しています。

    この機能は、AIエージェントがより自律的に、かつ高度な作業をこなせるようになるための重要な一歩と言えるでしょう。ただし、コードを実行するという特性上、セキュリティには十分注意し、信頼できるコードのみを使用することが肝要です。Claude Skillsは、AIの可能性を広げ、エンジニアの業務効率化に貢献する新しいツールとして注目されています。

    引用元: https://azukiazusa.dev/blog/claude-skills-custom-skills-for-claude/

    • Spec Kit で SRE AI Agent を開発する長い旅の始まり
    • この記事は、SRE(Site Reliability Engineering)業務を自律型AIで自動化・半自動化する「SRE AI Agent」の開発プロジェクトについて、GitHubが提供する「Spec Kit」と「スペック駆動開発(SDD)」を活用する実践例を紹介しています。著者は「No human labor is no human error(人間が関わらなければ人間のミスは起きない)」をミッションに掲げ、AIによるSRE業務の自動化とSREチームの負担軽減を目指しています。

      Spec KitとSDDは、従来のソフトウェア開発の考え方を大きく変えるものです。これまでは「コードが王様」で仕様は補助的な役割でしたが、SDDでは「仕様が王様」となります。詳細な仕様をAIに与えることで、AIが直接コードを生成し、実装まで一貫して支援してくれる新しい開発アプローチです。これにより、仕様と実際のコードの間に生じるギャップを減らし、開発の品質と効率を高めることを目指します。

      Spec Kitを使った開発は、以下のようなステップで進みます。まず、プロジェクトの原則をAIと共に確立します。次に、技術的な詳細を避けつつ「何を(What)」作りたいのか、「なぜ(Why)」それが必要なのかという「仕様」をAIに記述させます。この際、大規模言語モデル(LLM)の特性を考慮し、一度に全て決めず、小さな部品ごとに定義し段階的に進めるのがポイントです。

      仕様が決まったら、今度は「どのように(How)」実装するかという「技術実装計画」をAIに作成させます。ここではPythonのバージョンやAWSの構成など、具体的な技術要素を指定します。さらに、この計画を基に、より細かな「タスク」へとブレイクダウンします。

      そして「実装」です。AIエージェントにタスクごとにコードを生成させ、一つ一つのタスクを完了させていきます。ここで重要なのは、人間が直接コードを修正しないというSDDの原則です。もしコードに修正が必要な場合は、まず「仕様」を修正し、その修正された仕様に基づいてAIに新たなタスクを作成させ、再実装を進めます。

      また、Spec Kitには、仕様、計画、タスクの整合性を分析する機能や、要件の品質を保証するためのカスタムチェックリストを生成する機能もあります。これにより、開発の早い段階で問題を発見し、解決に導くことができます。

      著者は、SDDとLLMの組み合わせが、開発における迷走や手戻りを減らし、システム開発の新たな選択肢の一つになると期待しています。AIの能力向上、ソフトウェアの複雑化、要件変化の高速化に対応する手段として、このアプローチが注目されています。新人エンジニアの皆さんにとって、AIが開発プロセス全体を支援する未来を垣間見ることができる、興味深い取り組みと言えるでしょう。

      引用元: https://zenn.dev/ryoyoshii/articles/053ebb9b4cdc58

      • Why Your AI Agents Need a Todo List
      • AIエージェントの開発で、「エージェントが途中で迷子になる」「同じことを繰り返す」「まだ終わっていないのに完了したと主張する」といった壁にぶつかったことはありませんか?これは、AIの賢さが足りないのではなく、エージェントの設計(アーキテクチャ)に問題があることが多いと、この記事は指摘しています。

        解決策として提案されているのは、「タスク駆動型アーキテクチャ」です。これは、AIエージェントに私たちエンジニアが使うような「Todoリスト」を強制的に持たせるという考え方です。

        なぜTodoリストが重要なのでしょうか?

        私たち人間も、漠然とした指示ではうまく動けませんよね。「これを作って」というだけでは、何から手をつけて、どこまでやれば終わりなのかが曖昧になりがちです。AIエージェントも同じで、明確なタスクリスト、それぞれのタスクの「完了基準」、そして「完了したことの検証」がなければ、効率的かつ正確に作業を進められないのです。

        タスク駆動型アーキテクチャでは、具体的に次のように進めます。

        1. 明示的なTodoリスト: エージェントは、各タスクの「内容」「完了検証方法」「完了状況」を記したリストを受け取ります。
        2. 厳格な実行ループ: エージェントはリストの未完了タスクを一つずつ実行します。
        3. 証拠に基づく検証: タスクが完了したら、その証拠(例:コードが動いた証拠、ログなど)を提示し、システムがそれを検証します。
        4. 完了するまで次へ進めない: 全てのタスクが検証済みになるまで、エージェントは次のフェーズに進むことができません。これにより、未完了のまま「終わった」と主張するのを防ぎます。
        5. このアプローチは、AIエージェントが「何をすべきか」「どこまで進んだか」を常に確認できる「外部記憶」の役割を果たし、指示が曖昧なことで起こる問題を解決します。

          実際にこの仕組みを導入した経験から、以下の点が重要だと述べています。

          • AIの「思考の柔軟さ(温度設定)」をタスクに合わせて変える: 確実に動かすインフラ系のタスクは柔軟性を低く(例:0.0)、アイデア出しのようなクリエイティブなタスクは柔軟性を高く(例:0.5)設定します。
          • 明確な完了基準: 「ログインページを作る」ではなく、「ユーザー名/パスワード入力欄があり、送信ボタンを押すと/api/auth/loginにリクエストを送り、JWTをコンソールに出力するログインページを作る」のように具体的に定義します。
          • 進捗の監視: 完了率やエラー頻度などを追跡し、データに基づいて改善します。
          • タスクの細分化: 大きなタスクは細かく分割し、明確なステップにします。
          • 完了には「証拠」を求める: 「終わった」と信じるのではなく、「UIが動いているスクリーンショット」や「APIレスポンスのcurl出力」などの証拠を求めます。
          • 専門家エージェントに分ける: 全てをこなす万能エージェントではなく、「要件分析」「UI設計」「バックエンド実装」のように役割を分け、連携させることで、複雑な問題を効率的に解決します。
          • タスク駆動型アーキテクチャは、最新のLLMを使うこと以上に、堅牢で信頼性の高いAIエージェントを開発するための土台となります。これにより、エージェントは信頼性が高く、デバッグしやすく、ユーザーから信頼され、スケールしやすいものになります。新人エンジニアの皆さんも、AIエージェントを設計する際は、まずはこの「Todoリスト」のアプローチを検討してみてください。

            引用元: https://blog.justcopy.ai/p/why-your-ai-agents-need-a-todo-list

            • YouTubeに突如現れた「じゃんけん女子高生」…なんとアニメーターの渡辺明夫氏が描いていた!本人に当時のことを直撃してみた
            • YouTubeで突如バズった約30年前のアーケードゲーム「じゃんけん女子高生」。その可愛いキャラクターは、人気アニメーターの渡辺明夫さんがデザインしていました。渡辺さんへのインタビューで、女子高生は初心者向けサブキャラで、実は猫や舞妓さんがメインだったこと、特徴的な鼻の穴へのこだわりなどが明かされました。当時は規制でほとんど世に出なかった幻のゲームが今注目され、「恥ずかしいが、実績を見てもらえて嬉しい」と、当時の想いを語っています。

              引用元: https://www.gamespark.jp/article/2025/10/26/158774.html

              • お便り投稿フォーム
              • VOICEVOX:春日部つむぎ

                ...more
                View all episodesView all episodes
                Download on the App Store

                株式会社ずんだもん技術室AI放送局By 株式会社ずんだもん技術室AI放送局