البيانات الوصفيّة والقوّة الخفيّة!
جهاد أبوشهيوة

البيانات الوصفيّة والقوّة الخفيّة!
في الواقع، حياتنا الرقميّة تُعتبر كنز بالنسبة للشركات، حيث إنّ العملة الأكثر قيمة في وقتنا الحالي هي البيانات؛ مقدار الإحصائيّات والدراسات والخوارزميّات اللي من الممكن برمجتها ليس لها حدود، فالبيانات قوّة، وهذا علاش دائمًا نسمعوا بتنافس الحكومات والشركات الكبرى على مثل الأشياء هذي.

في عصر التكنولوجيا، قد تُذهل من كميّة البيانات اللي تملكها الشركات والمواقع الكبرى عنك، أبسط تفاصيل حياتك اليوميّة اللي عمرك ما عطيتها اهتمام قد تكون كنز بالنسبة للآخرين.


فشن هي البيانات؟ وشن هي البيانات الوصفيّة؟ وما الفرق بينهم؟ وكيف يؤثّر الجمع بين الاثنين على المُحتوى المقترح لنا على الإنترنت؟


البيانات أو الـ(Data) هي عبارة عن مجموعة من المعلومات، مرّات تكون على هيئة كلمات أو ملاحظات أو حقائق أو أوصاف لأشياء معيّنة، ومش لازم تكون "إخباريّة".


أمّا البيانات الوصفيّة أو الـ(Meta Data)، فهي عبارة عن تفاصيل دقيقة عن البيانات نفسها، وهذا علاش يقولولها "بيانات البيانات"، ودائمًا تكون "إخباريّة"، وتتمثّل البيانات الوصفيّة في شرح أو إعطاء بيانات عن نوع معيّن من البيانات، زي وصف ملف معين، مثلًا: اسمه، وحجمه، وصيغته، والتاريخ اللي أُنشئ فيه، وهكي... يعني بيانات عن البيانات نفسها.


وللبيانات الوصفيّة أنواع:

  • البيانات الوصفيّة الهيكليّة: تصف العلاقة بين مجموعة من المصادر الرقميّة، وكمثال: ربط بيانات (صورة معيّنة) بخبر معيّن (بيانات وصفيّة).

  • البيانات الوصفيّة التقنيّة:  البيانات الرقميّة، مثلًا: ذكر مواصفات ومعلومات على نوع العدسة اللي قامت بالتقاط صورة معيّنة.

  • البيانات الوصفيّة الوصفيّة: وهذي فيها بالزبط شرح واضح للبيانات وشن فيها، مثلًا: وصف لصورة وماذا يحدث فيها: "صورة لحريق في ضواحي مدينة طرابلس".

  • البيانات الوصفيّة الإداريّة: تحدّد كيفيّة التخزين والتصنيف لكل نوع من أنواع البيانات.

  • بيانات تعريف الحقوق: توضّح من ليه الحق في توزيع أو إعادة نشر جزء معيّن من المعلومات.


مش بالضرورة أنّ يكون لكلّ البيانات بيانات وصفيّة، لكن من غير البيانات الوصفيّة حتكون عمليّة البحث والتصنيف والأرشفة صعبة جدًّا لهذا النوع، فلذلك هي ضرورة، وهذا يعني وين ما فيه بيانات حيكون فيه بيانات وصفيّة خاصّة بيها.


على سبيل المثال، المكتبات تستخدم في البيانات الوصفيّة لترتيب البيانات حسب الكاتب والناشر وتاريخ النشر، باستخدام البيانات الثلاثة هذي، يقدروا وبسهولة أنّ يلقوا أي كتاب يبّوه بالتحديد.


اليوم، أغلب المواقع تعتمد على الزيارات من محرّكات البحث -زي جوجل مثلًا- باش تقدر تبني جمهور، ومحرّكات البحث في حد ذاتها تعتمد على استخدام البيانات الوصفيّة باش تقدر تقترح محتوى معيّن للمستخدمين، فكل ما كانت البيانات الوصفيّة أكثر دقّة وتنظيم، زادت احتماليّة ظهور البيانات واقتراحها للمستخدمين.


والأمر هذا ينطبق على جميع أنواع البيانات، وبالذات البيانات اللي ما تكونش نصيّة، زي الصور مثلًا، حيكون من الصعب البحث عليها إلّا في حالة كون البيانات الوصفيّة خاصتها دقيقة ومنظمة.


وهذا الأمر يخلّف حاجتين وراءه، اهتمام الشركات بالبيانات والبيانات الوصفيّة، وحقيقة المحتوى المُقترح واللي نتعرّضوله بشكل يومي على الإنترنت.


  • علاش الشركات تهتم بالأمر هذا هلبا؟

بالنظر إلى كميّة المحتوى اللي يتم إنشاءه ونشره كل يوم من قِبل وسائل الإعلام والشركات، فمن الضروري أنّ يكون المحتوى منظّم جيّدًا، وزي ما ذكرنا سابقًا، حتّى يقدروا يحصّلوا زيارات من محركات البحث، لازم ما البيانات اللي تُنشر داخل مواقع الشركات تكون منسّقة ومنظّمة بشكل صحيح لعناكب محرّكات البحث حتّى تُظهر النتائج بشكل يتوافق مع معايير المحركات هذي.


  • هل المحتوى اللي نتعرّضوله "غير متنوّع"؟

في الواقع، حياتنا الرقميّة تُعتبر كنز بالنسبة للشركات، حيث إنّ العملة الأكثر قيمة في وقتنا الحالي هي البيانات؛ مقدار الإحصائيّات والدراسات والخوارزميّات اللي من الممكن برمجتها ليس لها حدود، فالبيانات قوّة، وهذا علاش دائمًا نسمعوا بتنافس الحكومات والشركات الكبرى على مثل الأشياء هذي.


فبالنسبة للمواقع وخدمات الإنترنت الكبرى، البيانات -بكافّة أنواعها- اللي ننشروا ونشاركوا فيها طواعيّة (برضاك لأنّك أنتَ وافقت على الشروط هذي) زي اسمك ومواليدك واهتماماتك والمدينة اللي أنتَ قاعد فيها، تُدمج مع بيانات أخرى عليك من مستخدمين آخرين ومن مصادر أخرى خارجيّة لصناعة "ملف شخصي افتراضي" خاص عنك، وقد تُذهل من كميّة المعلومات اللي يحتويها عليك.


وبوضع الأيادي على الكمّ الهائل من البيانات هذا، مش لازم للمواقع الكُبرى أنّها تعرف بالزبط شن اللي دار بينك وبين طبيبك في محادثة خاصّة بينكم مثلًا، ولكن بالنظر إلى البيانات الوصفيّة، يمكن التنبّؤ بأنّك تعاني من مرض معيّن بعد تواصلك مع الطبيب على الإنترنت وتوقّفك على الصيدليّة وأنت عائد إلى منزلك، وبحثك في Google عن استخدام الدواء "X".


وعلى سبيل المثال أيضًا، بأخذ خدمة "أصدقاء قد تعرفهم" من Facebook، ما تتفاجأش لو بعد ما روّحت للمنزل لقيت حد من اللي شفتهم في عيّادة الطبيب في اقتراحات الخدمة هذي؛ في النهاية وُجدتم لمدة معينة من الزمن في نفس الموقع الجغرافي. كذلك ربّما يقترح Google أمر كان في بالك لفترة طويلة، وقد تشك إنّ جهازك يتنصّت عليك.


وحتّى لو أنتَ حريص على بياناتك ومانع مشاركة بيانات الموقع مع مثل هذي الخدمات، فيه هلبا طرق أخرى من الممكن أنّ يحصّلوها بيها، فبمجرّد نشرك لصورة معيّنة على إحدى المواقع هذي، وبالنّظر فقط إلى البيانات الوصفيّة، حيقدروا يشوفوا بيانات الموقع الجغرافي والتوقيت والتاريخ بالتحديد، ونوعيّة الهاتف، ولو فيه حد ثاني كان معاك... وبهكّي حيعرفوا أنّك في ذاك اليوم كنت في ذاك المكان.


في الواقع، هي عمليّة عظيمة لجمع البيانات وتحليلها بشتّى أنوعها، فبدراسة كلّ هذه البيانات في الماضي ومراقبتها في الحاضر والأشياء اللي تدير فيها توّا؛ هذا يعطيهم خيارات حتى للتنبّؤ بالمستقبل!


لو كنت حتغيّر رأيك السياسي حول شيء معين؟ لو حتبدا مدمن على مادّة معيّنة؟ لو حتشري درّاجة ناريّة بدلًا من سيّارة أحلامك مثلًا؟! من ثمّ، التأثير على نوعيّة المحتوى اللي يكون موجّه لينا، وجعله دائمًا في حالة تخصيص ليك أنت واهتماماتك وشخصيّتك.


صح مرّات يكون شيء إيجابي ويسهّل علينا حياتنا الافتراضيّة، كوننا ضمن دائرتنا الحياتيّة، لكن كميّة البيانات الهائلة هذي تُعطي الإمكانيّة للتأثير على الناس وبقوّة، وليها جانب مخيف لا يمكن التغاضي عنه!

من إظهار إعلانات لشراء منتجات، وحتّى عرض أخبار وتنسيق مظاهرات واحتجاجات والتأثير على رأيك السياسي، وغيره من القضايا الحرجة!





مواضيع أخرى قد تهمك