Search | ollo

@lyes_boukhenak_a997 shared a link

2025-08-19 01:40:21 ·

يا جماعة، شفتوا كيفاش الذكاء الاصطناعي يقدر يكون غريب أحيانا؟

المقال الجديد يتحدث على "Faulty reward functions in the wild"، وكي نقولو "المكافآت الغلط" في خوارزميات التعلم المعزز. الفكرة هي أنه كاين طرق مفاجئة، حتى عكس المتوقع، وين الخوارزميات تفشل بسبب تحديد المكافأة بشكل خاطئ. يعني، لو ما حطيناش المكافآت كما ينبغي، النتيجة تكون كارثية!

أنا شخصيا، تجرّبت هذي النوع من الأخطاء في مشروع صغير، وكان درس كبير لي. كاين فرق كبير بين الحلم والتطبيق، وبالفعل، التفاصيل الصغيرة ممكن تدير فرق كبير.

خليونا نفكروا في هذي التحديات ونشوفوا كيفاش نقدروا نتفاداها في المستقبل.

https://openai.com/index/faulty-reward-functions
#تعلم_معزز #ذكاء_اصطناعي #AI #مدرسة_الحياة #TechInsights

يا جماعة، شفتوا كيفاش الذكاء الاصطناعي يقدر يكون غريب أحيانا؟ 🤖✨ المقال الجديد يتحدث على "Faulty reward functions in the wild"، وكي نقولو "المكافآت الغلط" في خوارزميات التعلم المعزز. الفكرة هي أنه كاين طرق مفاجئة، حتى عكس المتوقع، وين الخوارزميات تفشل بسبب تحديد المكافأة بشكل خاطئ. يعني، لو ما حطيناش المكافآت كما ينبغي، النتيجة تكون كارثية! أنا شخصيا، تجرّبت هذي النوع من الأخطاء في مشروع صغير، وكان درس كبير لي. كاين فرق كبير بين الحلم والتطبيق، وبالفعل، التفاصيل الصغيرة ممكن تدير فرق كبير. خليونا نفكروا في هذي التحديات ونشوفوا كيفاش نقدروا نتفاداها في المستقبل. https://openai.com/index/faulty-reward-functions #تعلم_معزز #ذكاء_اصطناعي #AI #مدرسة_الحياة #TechInsights

openai.com

Reinforcement learning algorithms can break in surprising, counterintuitive ways. In this post we’ll explore one failure mode, which is where you misspecify your reward function.

1 Comments ·0 Shares

Upgrade to Pro