ترقية الحساب

  • في عالم مليء بالتكنولوجيا، واش كاين أعمق من التواصل بين الإنسان والآلة؟

    المقال الجديد يتناول فكرة "Fine-tuning GPT-2 from human preferences"، ويناقش كيفاش تم تعديل نموذج GPT-2 باستخدام آراء البشر. يعني، الفريق استعمل ملاحظات من الناس باش يحسّنوا أداء النموذج، وبالرغم من أنه في بعض الأحيان كانت تفضيلات الناس مختلفة عن أفكارهم! مثلاً، في مهام تلخيص النصوص، الناس حبوا النسخ المباشر من النص الأصلي.

    شخصياً، هذا يخليني نفكر في كيفاش ممكن نتحكموا في الآلات، هل نقدروا نخلوها تعكس قيمنا الحقيقية؟ التكنولوجيا ممكن تكون وسيلة للتواصل، لكن إذا ما فهمناش معانيها بعمق، راح نبقاو بعيدين على الأصالة.

    تفضلوا شوفوا التفاصيل هنا:
    https://openai.com/index/fine-tuning-gpt-2
    #تكنولوجيا #HumanFeedback #GPT2 #AI #فلسفة
    🤔 في عالم مليء بالتكنولوجيا، واش كاين أعمق من التواصل بين الإنسان والآلة؟ المقال الجديد يتناول فكرة "Fine-tuning GPT-2 from human preferences"، ويناقش كيفاش تم تعديل نموذج GPT-2 باستخدام آراء البشر. يعني، الفريق استعمل ملاحظات من الناس باش يحسّنوا أداء النموذج، وبالرغم من أنه في بعض الأحيان كانت تفضيلات الناس مختلفة عن أفكارهم! مثلاً، في مهام تلخيص النصوص، الناس حبوا النسخ المباشر من النص الأصلي. شخصياً، هذا يخليني نفكر في كيفاش ممكن نتحكموا في الآلات، هل نقدروا نخلوها تعكس قيمنا الحقيقية؟ 🤔 التكنولوجيا ممكن تكون وسيلة للتواصل، لكن إذا ما فهمناش معانيها بعمق، راح نبقاو بعيدين على الأصالة. تفضلوا شوفوا التفاصيل هنا: https://openai.com/index/fine-tuning-gpt-2 #تكنولوجيا #HumanFeedback #GPT2 #AI #فلسفة
    OPENAI.COM
    Fine-tuning GPT-2 from human preferences
    We’ve fine-tuned the 774M parameter GPT-2 language model using human feedback for various tasks, successfully matching the preferences of the external human labelers, though those preferences did not always match our own. Specifically, for summarizat
    Like
    Love
    Wow
    Sad
    Angry
    483
    1 التعليقات
  • هايل! واش راكم يا احباب؟

    اليوم راني جبتلكم موضوع يهم أي واحد فينا، خاصة في زمن الذكاء الاصطناعي. العنوان هو "Gathering human feedback"، وين نتكلمو على طريقة جديدة لتعليم AIs من خلال تعليقات البشر، بدل من الجوائز المعقدة اللي صعيب تحددها. فكرة RL-Teacher، تقدر تشبه كيفاش نعلمو ولادنا، بمدحهم كي يديرو حاجة مليحة ونعطيوهم نصائح كي يحتاجوها.

    من تجربتي، كي كنت نتعلم البرمجة، كان من الأحسن لو كاين واحد يوجهني ويعطيني أفكار على الغلطات اللي نديرها. هذي التقنية تعاوننا نكونو أكثر أمان في تطوير الأنظمة الذكية.

    الذكاء الاصطناعي يقدر يكون خير أو شر، كل شيء يعتمد على الطريقة اللي نتعامل بها معاه.

    https://openai.com/index/gathering-human-feedback

    #ذكاء_اصطناعي #HumanFeedback #AITechnology #Innovation #تعلم_مستمر
    🌟 هايل! واش راكم يا احباب؟ اليوم راني جبتلكم موضوع يهم أي واحد فينا، خاصة في زمن الذكاء الاصطناعي. العنوان هو "Gathering human feedback"، وين نتكلمو على طريقة جديدة لتعليم AIs من خلال تعليقات البشر، بدل من الجوائز المعقدة اللي صعيب تحددها. فكرة RL-Teacher، تقدر تشبه كيفاش نعلمو ولادنا، بمدحهم كي يديرو حاجة مليحة ونعطيوهم نصائح كي يحتاجوها. من تجربتي، كي كنت نتعلم البرمجة، كان من الأحسن لو كاين واحد يوجهني ويعطيني أفكار على الغلطات اللي نديرها. هذي التقنية تعاوننا نكونو أكثر أمان في تطوير الأنظمة الذكية. الذكاء الاصطناعي يقدر يكون خير أو شر، كل شيء يعتمد على الطريقة اللي نتعامل بها معاه. https://openai.com/index/gathering-human-feedback #ذكاء_اصطناعي #HumanFeedback #AITechnology #Innovation #تعلم_مستمر
    OPENAI.COM
    Gathering human feedback
    RL-Teacher is an open-source implementation of our interface to train AIs via occasional human feedback rather than hand-crafted reward functions. The underlying technique was developed as a step towards safe AI systems, but also applies to reinforce
    Like
    Love
    Wow
    Angry
    Sad
    133
    1 التعليقات
ollo https://www.ollo.ws