عندما طور عملاق الانترنت جوجل أحدث نسخة من نظام تشغيل الهواتف المحمولة أندرويد، قام ببعض التغييرات على الطريقة التي يفسر بها النظام الأوامر الصوتية. تحول النظام ليعمل وفقاً لـ الشبكة العصبية – وهو نظام محوسب يتصرف كالعقل البشري.

ويقول فنسنت فانهوك Vincent Vanhoucke وهو عالم أبحاث جوجل الذي ساعد في تحقيق ذاك الجهد أن النتائج كانت مثيرة لكثير من المستخدمين. ” قد كانت المفاجأة أننا تمكنا من القيام بذلك بشكل أفضل بكثير بمجرد تغيير النموذج”

يقول فانهوك أن معدل الخطأ في الإصدار الجديد من اندرويد – المعروف باسم جيلي بين Jelly Bean – حوالي 25 %  أقل من الإصدارات السابقة من البرنامج، وهذا يجعل الناس أكثر ارتياحاً في التعامل مع الأوامر الصوتية.يميل المستخدمون اليوم، كما يقول، إلى استخدام اللغة الطبيعية أكثر عند الحديث على الهاتف. وبعبارة أخرى، تقل تصرفاتهم كأنهم يتحدثون إلى روبوت. ” إنها تغيير الطريقة التي يتصرف الناس فعلاً.”

جيف دانالأمر هنا مجرد مثال على الطريقة التي تغير بها خوارزميات الشبكة العصبية طريقة عمل التكنولوجيا – وطريقة استخدامها بالنتيجة. خف الاهتمام بهذا المجال من الدراسة لسنوات عديدة، بعد أن كان أحد أهم مجالات البحث في الثمانينات ، ولكنه عاد الآن ، من خلال مشاركة مايكروسوفت و IBM لجوجل في استكشاف بعض التطبيقات الحقيقية.

عندما تتحدث إلى نظام التعرف على الصوت في أندرويد يقطع ما قمت بقوله ويرسله إلى ثمانية أجهزة كمبيوتر مختلفة من جيش جوجل من الخوادم المنتشر في جميع أنحاء العالم ، ثم تتم معالجتهاباستخدام نماذج الشبكة العصبية التي بناها فانهوك وفريقه. اشتهرت جوجل بقدرتها على تقسيم وظائف الحوسبة الكبيرة ومعالجتها بشكل سريع جداً، ولمعرفة كيف يتم ذلك اتجهت جوجل إلى جيف دان Jeff Dean  وفريقه من المهندسين، وهي مجموعة تعرف بأنها الأفضل لتغيير الطرق التي يعمل بها مركز البيانات الحديثة.

تعطي الشبكات العصبية الباحثين مثل فانهوك طريقة تحليل الكثير والكثير من الأنماط – في حال جيلي بيين، نمط الكلمة المنطوقة – ومن ثم التنبؤ بما يمكن للنمط الجديد أن يمثل. 

تنبع الاستعارة من علم الأحياء، حيث تشكل الخلايا العصبية في الجسم شبكات مع الخلايا الأخرى التي تسمح لهم بمعالجة الإشارات بطرق متخصصة. في هذا النوع من الشبكة العصبية التي يستخدمها جيلي بيين، قد يبني جوجل عدة نماذج لكيفية عمل اللغة  كطلبات البحث الصوتي في اللغة الإنجليزية على سبيل المثال – من خلال تحليل مساحات واسعة من البيانات الحقيقية.

ويقول جيفري هينتون Geoffrey Hinton، أستاذ علوم الحاسوب في جامعة تورونتو: اعتقد الناس لفترة طويلة جداً – اعتماداً على ما يرونه في الدماغ بشكل جزئي – أن نظام الإدراك الحسي يستخدم طبقات متعددة من الميزات.  “ولكن السؤال هو كيف يمكنك تعمل تلك الكفاءة.”

يأخذ أندرويد صورة للأمر الصوتي وتقوم جوجل بمعالجته باستخدام نموذج الشبكة العصبية لمعرفة ما يقال.

يحاول برنامج جوجل أولاً اختيار أجزاء فردية من الحديث – الأنواع المختلفة من الحروف الصوتية والحروف الساكنة التي تشكل الكلمات. هذا طبقة واحدة من الشبكة العصبية. ثم يستخدم تلك المعلومات لبناء التخمينات الأكثر تعقيدا، كل طبقة من تلك الصلات تقربنا من معرفة ما يقال.

ويمكن استخدام خوارزميات الشبكة العصبية لتحليل الصور أيضا.  ، يقول هينتون: ما تريد القيام به هو العثور على قطع صغيرة من الهيكل في البكسلات، على سبيل المثال حافة الصورة. قد يكون لديك طبقة من أجهزة الكشف عن ميزات تكشف عن أشياء مثل الحواف الصغيرة. ثم وبمجرد الانتهاء من ذلك تكشف طبقة أخرى من أجهزة الكشف عن تركيبات صغيرة من الحواف مثل زوايا. وبمجرد الانتهاء من ذلك، لديك طبقة أخرى وهلم جرا. 

وعدت الشبكات العصبية بالقيام بشيء من هذا القبيل في الثمانينات، ولكن كان من الصعب جعل الأشياء تعمل في مستويات متعددة من التحليل كالتي يصفها هينتون.

ولكن في عام 2006، كان هناك تغييران كبيران. الأول، وجد هينتون وفريقه طريقة أفضل لرسم الشبكات العصبية العميقة – شبكات تصنع اتصالاً بين الطبقات المختلفة.  أما التغيير الثاني، هو انخفاض تكلفة وحدات المعالجة الرسومية ، وبالتالي إعطاء الأكاديميين وسيلة أرخص بكثير وأسرع للقيام بالمليارات من العمليات الحسابية التي يحتاجونها. “كان الفرق كبيراً لأنه جعل الأمور أسرع بـ 30 مرة”، وفقاً لهينتون.

اليوم، بدأت خوارزميات الشبكة العصبية بالتسلل إلى برامج التعرف على الصوت وبرامج التصوير، ولكن يرى هينتون أنه بما أنها أصبحت مستخدمة في أي مكان ويجب على شخص ما التنبؤ. استخدم فريق جامعة تورونتو في نوفمبر الشبكات العصبية للتنبؤ بكيفية تصرف جزيئات الدواء في العالم الحقيقي.

يقول جيف دين أن غوغل يستخدم خوارزميات الشبكة العصبية الآن في مجموعة متنوعة من المنتجات – بعضها للتجارب، أو غيرها – ولكن ليس هناك ما يضاهي بين للتعرف على الكلام. يتابع: “هناك ارتباط واضح بالبحث عن الصور، ربما نرغب أن نكون قادرين على استخدام بكسل من الصورة وتحديد محتواها.” يمكن لجوجل ستريت فيو استخدام خوارزميات الشبكة العصبية لمعرفة الفرق بين الكائنات المختلفة في الصور – منزل أو لوحة سيارة ، على سبيل المثال.

لا تظن أن هذا لا يهم الناس العاديين. صنع باحثي جوجل العام الماضي، بما في ذلك دين، برنامج الشبكة العصبية التي تحدد القطط على موقع يوتيوب.

تدرس مايكروسوفت و IBM الشبكات العصبية أيضاً. عرض مدير بحوث مايكروسوفت ريك راشد في أكتوبر عرضاً حياً لبرنامج مايكروسوفت الصوتي القائم على الشبكة العصبية في تيانجين، الصين. في العرض، تحدث راشد باللغة الإنجليزية وتوقف بعد كل عبارة. وفرح الجمهور، حيث ترجم برنامج مايكروسوفت ما كان يقوله وقاله باللغة الصينية. عدل البرنامج لهجته لتشبه صوت رشيد.

يقول راشد: “هناك الكثير مما يجب القيام به في هذا المجال، هذه التكنولوجيا واعدة جدً ونأمل في السنوات القليلة القادمة أن نكون قادرين على كسر حواجز اللغة بين الناس. شخصيا، أعتقد أن هذا سيقودنا إلى عالم أفضل.”

من Wired