تسأل ChatGPT سؤالاً بسيطاً. يجيب بثقة وطلاقة وبشكل خاطئ تماماً. يستشهد بدراسة غير موجودة. يذكر اسم الرئيس التنفيذي الذي لم يشغل الدور مطلقاً. يختلق قانوناً لم يتم تمريره أبداً. هذا هو هلوسة الذكاء الاصطناعي — وهو لا يزال أحد أكبر العقبات أمام الثقة في الذكاء الاصطناعي التوليدي في سير العمل الحقيقي.
لكن إليك ما لا يفهمه معظم الناس: الهلوسات ليست خللاً سيتم إصلاحه ببساطة. إنها ميزة هيكلية في كيفية عمل نماذج اللغة الكبيرة.لماذاتحدث هذه الهلوسات هو الخطوة الأولى لتقليلها بفعالية.
النقاط الرئيسية
- الهلوسات هي خاصية أساسية لنماذج اللغة الكبيرة، وليست عطلاً برمجياً بسيطاً — فهي تنبع من كيفية تنبؤ النماذج بالنصوص بشكل إحصائي.
- انخفضت معدلات الهلوسات بشكل كبير منذ عام 2018 لكنها لا تزال حول 18% في المتوسط في 2024.
- تقنيات الحث المحددة — مثل التأريض والتفكير المتسلسل وطلبات طلب المصادر — يمكن أن تقلل الهلوسات بنسبة 40–60%.
- توليد النصوص المعزز باسترجاع البيانات (RAG) هو الحل الأكثر فعالية على مستوى المؤسسات المتاح اليوم.
- تعامل دائماً مع مخرجات ChatGPT كمسودة أولى تتطلب التحقق البشري من الحقائق والإحصائيات والاقتباسات.
ما الذي يسبب هلوسة ChatGPT في الواقع؟
نماذج اللغة الكبيرة مثل GPT-4 ليست قواعد بيانات. لا تقوم بـ "البحث عن" الحقائق — بل تتنبأ بالكلمة التالية الأكثر احتمالاً إحصائياً بناءً على بيانات التدريب الخاصة بها. عندما تواجه النموذج فجوة بين ما تم تدريبها عليه وما تطلبه، فإنها لا تقول "لا أعرف". بل تملأ الفجوة بإجابة معقولة الصوت. هذا هو جوهر الهلوسة.
تشمل الأسباب الأساسية ما يلي:
- تواريخ قطع بيانات التدريب:معرفة ChatGPT لها تاريخ قطع، مما يعني أن أي سؤال حول الأحداث الأخيرة يشكل خطر هلوسة.
- الثقة بدون معرفة:تم تحسين النموذج لإنتاج ردود سلسة وتبدو مفيدة — مما يعني أن التردد أو عدم اليقين يتم التدريب عليهما من الخارج.
- الحث غير الواضح:الأسئلة الغامضة تعطي النموذج حرية كبيرة جداً لـ "ملء الفراغات" بشكل إبداعي.
- الاعتماد المفرط على مطابقة الأنماط:إذا كان النمط في بيانات التدريب شائعاً بما فيه الكفاية، فقد يعيد النموذج إنتاجه حتى عندما يكون خاطئاً من الناحية الحقائقية.
إذا كنت تريد الخوض بشكل أعمق في تحسين كيفية تفاعلك مع ChatGPT، فإن دليلنا حولإتقان ChatGPT: نصائح متقدمة وحالات استخدام فعلية لعام 2024يغطي استراتيجيات الحث التي تساعد في قيد سلوك النموذج بشكل كبير.
كم عدد معدلات الهلوسات التي تحسنت بالفعل؟
الخبر السار هو أن معدلات الهلوسات انخفضت بشكل كبير خلال السنوات الستة الماضية. الخبر السيء: إنها بعيدة جداً عن الصفر. إليك نظرة عامة على معدلات الهلوسات المقدرة عبر أجيال نماذج اللغة الكبيرة الرئيسية:
| السنة | معدل الهلوسات المقدر (%) |
|---|---|
| 2018 | 42% |
| 2019 | 38% |
| 2020 | 35% |
| 2021 | 31% |
| 2022 | 28% |
| 2023 | 22% |
| 2024 | 18% |
المصدر: تقدير ينتج عن الذكاء الاصطناعي بناءً على معايير الصناعة. تختلف المعدلات حسب نوع المهمة وإصدار النموذج ومنهجية التقييم.
قد يبدو معدل الهلوسات بنسبة 18% يمكن إدارته — لكن على نطاق واسع، هذا يعني أن حوالي 1 من كل 5 مطالب حقائق قد تكون خاطئة. بالنسبة للشركات التي تستخدمأتمتة ChatGPT API، هذا معدل خطأ ذو مغزى يتطلب استراتيجيات التخفيف.
تقنيات مثبتة لتقليل هلوسات ChatGPT
1. استخدم حث التأريض
يعني التأريض إعطاء النموذج سياقاً حقائقياً للعمل فيه، بدلاً من طلب منها إنشاء الحقائق من الصفر. بدلاً من السؤال "ما فوائد ملحق X؟"، قدم وثيقة المصدر واطلب من النموذج تلخيصذاك. هذا يقلل بشكل كبير من ميل النموذج لاختلاق المعلومات.
2. اطلب المصادر — ثم تحقق منها
طلب ChatGPT لـ "استشهاد بالمصادر" لا يضمن مصادر حقيقية، لكنه يضيف طبقة قابلة للتحقق يمكنك التحقق من الحقائق فيها. الأهم من ذلك، أنه يحول مخرجات النموذج إلى وضع تكون فيه الدقة مهمة، مما قد يقلل الاختلاق الواثق. تحقق دائماً من أي اقتباس بشكل مستقل.
3. استخدم حث التفكير المتسلسل
إضافة "فكر خطوة بخطوة" أو "اشرح منطقك قبل الإجابة" إلى الحث الخاص بك يجبر النموذج على جعل منطقه واضحاً. هذا يقلل الهلوسات لأن الأخطاء في المنطق تصبح مرئية وقابلة للتصحيح قبل أن تصل إلى الإجابة النهائية. للمطورين، يتضمن ملخصنا10 حث ChatGPT يجب أن يعرفها كل مطورعدة صيغ متسلسلة الفكر تستحق الحفظ.
4. ضع قيوداً صريحة
أخبر ChatGPT ما الذيلا يمكنأن تفعله: "استخدم فقط المعلومات التي أوفرها في هذا الحث. إذا كنت لا تعرف شيئاً، فقل ذلك صراحة." هذا التعليمات البسيطة تقلل بشكل كبير من الاختلاق الواثق — ميل النموذج لملء الفجوات دون الإشارة إلى عدم اليقين.
5. استفد من توليد النصوص المعزز باسترجاع البيانات (RAG)
بالنسبة للتطبيقات الموجهة للمؤسسات، RAG هو المعيار الذهبي. بدلاً من الاعتماد فقط على ما تعلمته النموذج أثناء التدريب، تسترجع أنظمة RAG المستندات ذات الصلة من قاعدة معرفة موثوقة في وقت الاستعلام، ثم تستخدمها كسياق للإنشاء. وفقاًلورقة RAG الأصلية من Meta AI Research، يتفوق هذا النهج بشكل كبير على الإنشاء القياسي في المهام التي تتطلب معرفة مكثفة.
6. ضبط درجة الحرارة والمعاملات
عند استخدام ChatGPT API، فإن خفض إعداد درجة الحرارة (أقرب إلى 0) يجعل المخرجات أكثر حتمية وأقل "إبداعاً" — مما يقلل خطر الهلوسة للمهام الحقائقية. درجات الحرارة الأعلى رائعة للعصف الذهني لكنها خطيرة على المحتوى الحساس للحقائق.
مقارنة الهلوسات: حالات استخدام مختلفة
| حالة الاستخدام | خطر الهلوسة | التخفيف الموصى به |
|---|---|---|
| الكتابة الإبداعية | تأثير منخفض | الحد الأدنى — الإبداع مرغوب فيه |
| تلخيص النص المقدم | منخفض | حث التأريض |
| الأسئلة والأجوبة العامة | متوسط | التفكير المتسلسل + التحقق |
| النصيحة القانونية / الطبية | مرتفع جداً | RAG + المراجعة البشرية الإلزامية |
| المطالبات الإحصائية | مرتفع | طلبات المصادر + التحقق من الحقائق |
| الأحداث الأخيرة (بعد القطع) | مرتفع جداً | مكون تصفح الويب أو البحث الخارجي |
الإنسان في الحلقة لا يزال غير قابل للتفاوض
لا يوجد إصلاح تقني يلغي الهلوسات بالكامل في 2024. البقاء الاستراتيجية الأكثر فعالية هو الجمع بين أفضل تقنيات الحث مع المراجعة البشرية المستمرة. يجب التعامل مع محتوى ينتج عن الذكاء الاصطناعي كمسودة قوية أولى، وليس كمنتج نهائي — خاصة بالنسبة لأي شيء حقائقي أو قانوني أو طبي أو مالي.
إذا كنت تعمل على تحسين الجودة الكلية لمخرجات الذكاء الاصطناعي الخاصة بك بخلاف مجرد التحكم في الهلوسة، فإن منشورنا علىكيفية تحسين جودة المحتوى الناتج عن الذكاء الاصطناعي بسرعةيغطي إطار عمل أوسع للتحسين التحريري.
يعترف OpenAI نفسه بالتحدي — يوصي دليلهمرسمي بشأن هندسة المطالباتبالعديد من تقنيات التأريض والقيد المناقشة هنا، مما يجعله يستحق القراءة لأي شخص ينشر ChatGPT على نطاق واسع.
الأسئلة الشائعة
هل ستتم إزالة هلوسات ChatGPT يوماً ما بالكامل؟
من غير المحتمل على المدى القريب. الهلوسات هي خاصية هيكلية لكيفية توليد نماذج اللغة الكبيرة للنصوص احتمالياً. بينما تستمر المعدلات في الانخفاض — من 42% في 2018 إلى حوالي 18% في 2024 — فإن الوصول إلى الصفر سيتطلب تغييرات معمارية أساسية يعمل الباحثون على تحقيقها.
هل GPT-4 أقل عرضة للهلوسة من GPT-3.5؟
نعم، بشكل ملموس. يظهر GPT-4 معدلات هلوسة منخفضة مقارنة بـ GPT-3.5، خاصة في مهام التفكير المعقد والاستعلامات كثيفة المعرفة. ومع ذلك، فهو ليس محصناً، وتنطبق استراتيجيات التخفيف نفسها على كلا النموذجين.
هل استخدام ChatGPT مع تصفح الويب يقلل الهلوسات؟
نعم — تمكين تصفح الويب (المتاح في ChatGPT Plus) يسمح للنموذج باسترجاع المعلومات في الوقت الفعلي بدلاً من الاعتماد فقط على بيانات التدريب. هذا فعال بشكل خاص للأحداث الأخيرة والإحصائيات وتفاصيل الأسعار أو المنتجات الحالية.
ما أسرع تغيير واحد يمكنني إجراؤه لتقليل الهلوسات اليوم؟
أضف هذه العبارة إلى الحث الخاص بك: "إذا كنت غير متأكد من أي حقيقة، فقل ذلك صراحة ولا تخمن." إنه قيد بسيط يزيد على الفور من الشفافية ويقلل الاختلاق الواثق.
هل الأدوات الأخرى لكتابة الذكاء الاصطناعي أقل عرضة للهلوسة من ChatGPT؟
جميع نماذج اللغة الكبيرة الرئيسية تهلوس بدرجات متفاوتة. تقوم بعض الأدوات بتطبيق آليات إضافية للتحقق من الحقائق أو التأريض على رأس النماذج الأساسية، مما قد يساعد. اطلع علىمقارنة أدوات كتابة الذكاء الاصطناعي المجانية مقابل المدفوعةللحصول على تفصيل لكيفية تعامل الأدوات المختلفة مع الدقة والموثوقية.
