
Sign up to save your podcasts
Or


AI倫理と報酬ハッキングについて話しました。
目標設定の落とし穴 / AIがズルをする理由 / 報酬ハッキングとは何か / テトリスAIが永遠に終わらない裏技 / ロボットが“掴まない”ことで報酬を得た話 / 人間も同じ失敗をしている / 手段が目的化する瞬間 / ハック思考と前提条件の分解 / スタートアップで前提を外す重要性 / 倫理とイノベーションの境界線
# 参考
Learning from human preferences | OpenAI
https://openai.com/index/learning-from-human-preferences/
Reward hacking - Wikipedia
https://en.wikipedia.org/wiki/Reward_hacking
📮 お便りはこちらから
https://forms.gle/FjfvyGc9Ua8uBPR99
https://twitter.com/HRM_09
📻ゴロゴロ起業ラジオ
https://open.spotify.com/show/7gw8wScrBTfiVdP6KTagsb
By ゴロゴロ起業ラジオAI倫理と報酬ハッキングについて話しました。
目標設定の落とし穴 / AIがズルをする理由 / 報酬ハッキングとは何か / テトリスAIが永遠に終わらない裏技 / ロボットが“掴まない”ことで報酬を得た話 / 人間も同じ失敗をしている / 手段が目的化する瞬間 / ハック思考と前提条件の分解 / スタートアップで前提を外す重要性 / 倫理とイノベーションの境界線
# 参考
Learning from human preferences | OpenAI
https://openai.com/index/learning-from-human-preferences/
Reward hacking - Wikipedia
https://en.wikipedia.org/wiki/Reward_hacking
📮 お便りはこちらから
https://forms.gle/FjfvyGc9Ua8uBPR99
https://twitter.com/HRM_09
📻ゴロゴロ起業ラジオ
https://open.spotify.com/show/7gw8wScrBTfiVdP6KTagsb

5 Listeners

16 Listeners

240 Listeners

9 Listeners

0 Listeners

6 Listeners

2 Listeners

1 Listeners

0 Listeners

0 Listeners

0 Listeners

0 Listeners

0 Listeners

0 Listeners

18 Listeners