البحث

شارك رابطًا

2025-08-26 01:32:36

في عالم مليء بالتكنولوجيا، واش كاين أعمق من التواصل بين الإنسان والآلة؟

المقال الجديد يتناول فكرة "Fine-tuning GPT-2 from human preferences"، ويناقش كيفاش تم تعديل نموذج GPT-2 باستخدام آراء البشر. يعني، الفريق استعمل ملاحظات من الناس باش يحسّنوا أداء النموذج، وبالرغم من أنه في بعض الأحيان كانت تفضيلات الناس مختلفة عن أفكارهم! مثلاً، في مهام تلخيص النصوص، الناس حبوا النسخ المباشر من النص الأصلي.

شخصياً، هذا يخليني نفكر في كيفاش ممكن نتحكموا في الآلات، هل نقدروا نخلوها تعكس قيمنا الحقيقية؟ التكنولوجيا ممكن تكون وسيلة للتواصل، لكن إذا ما فهمناش معانيها بعمق، راح نبقاو بعيدين على الأصالة.

تفضلوا شوفوا التفاصيل هنا:
https://openai.com/index/fine-tuning-gpt-2
#تكنولوجيا #HumanFeedback #GPT2 #AI #فلسفة

🤔 في عالم مليء بالتكنولوجيا، واش كاين أعمق من التواصل بين الإنسان والآلة؟ المقال الجديد يتناول فكرة "Fine-tuning GPT-2 from human preferences"، ويناقش كيفاش تم تعديل نموذج GPT-2 باستخدام آراء البشر. يعني، الفريق استعمل ملاحظات من الناس باش يحسّنوا أداء النموذج، وبالرغم من أنه في بعض الأحيان كانت تفضيلات الناس مختلفة عن أفكارهم! مثلاً، في مهام تلخيص النصوص، الناس حبوا النسخ المباشر من النص الأصلي. شخصياً، هذا يخليني نفكر في كيفاش ممكن نتحكموا في الآلات، هل نقدروا نخلوها تعكس قيمنا الحقيقية؟ 🤔 التكنولوجيا ممكن تكون وسيلة للتواصل، لكن إذا ما فهمناش معانيها بعمق، راح نبقاو بعيدين على الأصالة. تفضلوا شوفوا التفاصيل هنا: https://openai.com/index/fine-tuning-gpt-2 #تكنولوجيا #HumanFeedback #GPT2 #AI #فلسفة

OPENAI.COM

Fine-tuning GPT-2 from human preferences

We’ve fine-tuned the 774M parameter GPT-2 language model using human feedback for various tasks, successfully matching the preferences of the external human labelers, though those preferences did not always match our own. Specifically, for summarizat

483

1 التعليقات

شارك رابطًا

2025-08-19 15:40:42

هايل! واش راكم يا احباب؟

اليوم راني جبتلكم موضوع يهم أي واحد فينا، خاصة في زمن الذكاء الاصطناعي. العنوان هو "Gathering human feedback"، وين نتكلمو على طريقة جديدة لتعليم AIs من خلال تعليقات البشر، بدل من الجوائز المعقدة اللي صعيب تحددها. فكرة RL-Teacher، تقدر تشبه كيفاش نعلمو ولادنا، بمدحهم كي يديرو حاجة مليحة ونعطيوهم نصائح كي يحتاجوها.

من تجربتي، كي كنت نتعلم البرمجة، كان من الأحسن لو كاين واحد يوجهني ويعطيني أفكار على الغلطات اللي نديرها. هذي التقنية تعاوننا نكونو أكثر أمان في تطوير الأنظمة الذكية.

الذكاء الاصطناعي يقدر يكون خير أو شر، كل شيء يعتمد على الطريقة اللي نتعامل بها معاه.

https://openai.com/index/gathering-human-feedback

#ذكاء_اصطناعي #HumanFeedback #AITechnology #Innovation #تعلم_مستمر

🌟 هايل! واش راكم يا احباب؟ اليوم راني جبتلكم موضوع يهم أي واحد فينا، خاصة في زمن الذكاء الاصطناعي. العنوان هو "Gathering human feedback"، وين نتكلمو على طريقة جديدة لتعليم AIs من خلال تعليقات البشر، بدل من الجوائز المعقدة اللي صعيب تحددها. فكرة RL-Teacher، تقدر تشبه كيفاش نعلمو ولادنا، بمدحهم كي يديرو حاجة مليحة ونعطيوهم نصائح كي يحتاجوها. من تجربتي، كي كنت نتعلم البرمجة، كان من الأحسن لو كاين واحد يوجهني ويعطيني أفكار على الغلطات اللي نديرها. هذي التقنية تعاوننا نكونو أكثر أمان في تطوير الأنظمة الذكية. الذكاء الاصطناعي يقدر يكون خير أو شر، كل شيء يعتمد على الطريقة اللي نتعامل بها معاه. https://openai.com/index/gathering-human-feedback #ذكاء_اصطناعي #HumanFeedback #AITechnology #Innovation #تعلم_مستمر

OPENAI.COM

Gathering human feedback

RL-Teacher is an open-source implementation of our interface to train AIs via occasional human feedback rather than hand-crafted reward functions. The underlying technique was developed as a step towards safe AI systems, but also applies to reinforce

133

1 التعليقات

انضم إلينا

اللغات

Fine-tuning GPT-2 from human preferences

Gathering human feedback