النقاط الرئيسية
| النقطة | الوصف |
|---|---|
| مصادر المعلومات | تصدرت المنتديات والموسوعات التعاونية مثل Reddit وWikipedia. |
| مخاطر الاعتماد | تضليل المعلومات، تضخيم الروايات الشائعة، غياب السلطة المرجعية. |
| الهيمنة على المحتوى | محتوى غير خاضع لتحرير مؤسسي يعرض دقة المعلومات للخطر. |
مقدمة
احتلّت المنتديات والموسوعات التعاونية موقع الصدارة بين مصادر المعلومات للنماذج اللغوية الكبيرة (LLMs) مثل ChatGPT، وفقاً لدراسة من Semrush صدرت في يونيو 2025، اعتماداً على تحليل أكثر من 150.000 استشهاد.
هيمنة المحتوى
تشير بيانات Semrush إلى أن موقع Reddit تصدّر بنسبة استشهاد 40.1%، متقدماً على Wikipedia التي جاءت بنسبة 26.3%. هذا يدل على ميل النماذج إلى استقاء المعرفة من النقاشات المفتوحة.
ترتيب المصادر الأكثر استشهادًا
- Reddit (40.1%)
- Wikipedia (26.3%)
- YouTube (23.5%)
- Google (23.3%)
- Yelp (21.0%)
- Facebook (20.0%)
- Amazon (18.7%)
- Tripadvisor (12.5%)
- Mapbox (11.3%)
- OpenStreetMap (11.3%)
مخاطر الاعتماد على هذه المصادر
تظهر الدراسة أن الاعتماد على مواقع مثل Reddit وWikipedia يطرح العديد من المخاطر، مثل:
- المعلومات المضللة: عدم وجود مراجعة من خبراء يمكن أن يؤدي إلى نشر بيانات خاطئة.
- تضخيم الروايات الشائعة: نماذج الذكاء الاصطناعي قد تعتبر الروايات المتكررة حقائق.
- غياب السلطة المرجعية: خصوصًا في مجالات دقيقة مثل الطب والقانون.
التوزيع والبيانات المكانية
كشفت الدراسة عن اعتماد النماذج على منصات الخرائط الرقمية، حيث سجل Mapbox وOpenStreetMap معدلات استشهاد بلغت 11.3%.
موازنة بين الشعبية والموثوقية
يجب على المطورين تعديل خوارزمياتهم لإعطاء وزن أكبر للمصادر الأكاديمية.
استنتاجات ختامية
تشير نتائج تحليل Semrush إلى أن نماذج الذكاء الاصطناعي تتبنى محتوى ينشئه المستخدمون، مع حاجة ملحّة للتحقق من المصادر.
قسم الأسئلة الشائعة (FAQ)
ما هي المصادر الأكثر استخداماً؟
Reddit وWikipedia هما المصدران الرئيسيان.
ما هي المخاطر المرتبطة بهذه المصادر؟
المعلومات المضللة وتضخيم الروايات الشائعة.
كيف يمكن تحسين دقة المعلومات؟
من خلال تعزيز آليات التحقق من المصادر.
هل يعتمد الذكاء الاصطناعي على معلومات موثوقة؟
ليس دائماً، خاصة مع المصادر غير الخاضعة للرقابة.