معالجة اللغة الطبيعية

تعتبر معالجة اللغات الطبيعية (NLP) حقلًا فرعيًا من علوم الكمبيوتر وهندسة المعلومات والذكاء الاصطناعي الذي يهتم بالتفاعلات بين أجهزة الكمبيوتر واللغات البشرية (الطبيعية) ، وعلى وجه الخصوص كيفية برمجة أجهزة الكمبيوتر لمعالجة وتحليل كميات كبيرة من بيانات اللغة الطبيعية.

تتضمن التحديات في معالجة اللغات الطبيعية في كثير من الأحيان التعرف على الكلام ، وفهم اللغة الطبيعية ، وتوليد اللغة الطبيعية.

التاريخ
بدأ تاريخ معالجة اللغة الطبيعية بشكل عام في الخمسينات ، على الرغم من أنه يمكن العثور على العمل من فترات سابقة. في عام 1950 ، نشر آلان تورينج مقالة بعنوان “الذكاء” الذي اقترح ما يسمى الآن اختبار تورينج كمعيار للذكاء.

شملت تجربة جورجتاون في عام 1954 ترجمة تلقائية كاملة لأكثر من ستين جملة روسية إلى الإنجليزية. وادعى المؤلفان أنه في غضون ثلاث أو خمس سنوات ، ستكون الترجمة الآلية مشكلة تحل. ومع ذلك ، كان التقدم الحقيقي أبطأ بكثير ، وبعد تقرير ALPAC في عام 1966 ، والذي وجد أن الأبحاث التي استمرت عشر سنوات قد فشلت في تحقيق التوقعات ، تم تخفيض تمويل الترجمة الآلية بشكل كبير. تم إجراء مزيد من الأبحاث في الترجمة الآلية حتى أواخر الثمانينات ، عندما تم تطوير أول أنظمة ترجمة آلية إحصائية.

بعض أنظمة معالجة اللغات الطبيعية الناجحة التي تم تطويرها في الستينيات كانت نظام SHRDLU ، وهو نظام لغوي طبيعي يعمل في “عوالم محدودة” مقيدة بمفردات مقيدة ، و ELIZA ، وهو محاكاة لمدير علاج روجري ، كتبه جوزيف فايزنباوم بين عامي 1964 و 1966. لا توجد معلومات حول الفكر الإنساني أو العاطفة ، فإن إليزا في بعض الأحيان تقدم تفاعلًا شبيهاً بالإنسان. عندما تجاوز “المريض” قاعدة المعرفة الصغيرة جدًا ، قد توفر ELIZA استجابة عامة ، على سبيل المثال ، الاستجابة لـ “My head hurts” مع “لماذا تقول أن رأسك يؤلمك؟”.

خلال السبعينيات من القرن العشرين ، بدأ العديد من المبرمجين في كتابة “علم نظريات مفاهيمي” ، والتي نظمت معلومات العالم الحقيقي في بيانات مفهومة بالكمبيوتر. ومن الأمثلة على ذلك MARGIE (Schank، 1975)، SAM (Cullingford، 1978)، PAM (Wilensky، 1978)، TaleSpin (Meehan، 1976)، QUALM (Lehnert، 1977)، Politics (Carbonell، 1979)، Plot Units (Lehnert 1981 ). خلال هذا الوقت ، تم كتابة العديد من chatterbots بما في ذلك PARRY ، Racter ، و Jabberwacky.

حتى الثمانينيات ، كانت معظم أنظمة معالجة اللغات الطبيعية مبنية على مجموعات معقدة من القواعد المكتوبة بخط اليد. ولكن ابتداءً من أواخر الثمانينيات ، كانت هناك ثورة في معالجة اللغات الطبيعية مع إدخال خوارزميات التعلم الآلي لمعالجة اللغة. ويرجع ذلك إلى الزيادة المطّردة في القوة الحسابية (انظر قانون مور) والتخفيض التدريجي للهيمنة على نظريات تشومسكيان في علم اللغة (على سبيل المثال القواعد التحويلية) ، التي كانت قواعدها النظرية تثبط هذا النوع من علم اللغويات الجوهرية الذي يكمن وراء منهج التعلم الآلي. لمعالجة اللغة. بعض خوارزميات التعلم الآلي المستعملة ، مثل أشجار القرار ، أنتجت أنظمة من القواعد الثابتة إذا كانت مشابهة للقواعد اليدوية المكتوبة. ومع ذلك ، فإن وضع علامات على جزء من الكلام قد استفاد من استخدام نماذج ماركوف المخفية في معالجة اللغات الطبيعية ، وبشكل متزايد ، ركزت الأبحاث على النماذج الإحصائية ، التي تتخذ قرارات نزيهة احتمالية تقوم على ربط الأوزان الحقيقية بقيمة الميزات التي تشكل المدخلات. البيانات. نماذج اللغات المخبأة التي تعتمد عليها الآن العديد من أنظمة التعرف على الكلام هي أمثلة على مثل هذه النماذج الإحصائية. تكون مثل هذه النماذج أكثر قوة بشكل عام عندما تعطى مدخلات غير مألوفة ، وخاصة المدخلات التي تحتوي على أخطاء (كما هو شائع جدا لبيانات العالم الحقيقي) ، وتنتج نتائج أكثر موثوقية عندما يتم دمجها في نظام أكبر يشتمل على مهام فرعية متعددة.

وقد حدثت العديد من النجاحات المبكرة الملحوظة في مجال الترجمة الآلية ، ويرجع ذلك بصفة خاصة إلى العمل في IBM Research ، حيث تم تطوير نماذج إحصائية أكثر تعقيدًا على التوالي. وتمكنت هذه الأنظمة من الاستفادة من المخطوطات النصية المتعددة اللغات الموجودة التي أنتجها برلمان كندا والاتحاد الأوروبي نتيجة للقوانين التي تدعو إلى ترجمة جميع الإجراءات الحكومية إلى جميع اللغات الرسمية لنظم الحكم المقابلة. ومع ذلك ، فإن معظم الأنظمة الأخرى تعتمد على الكومبيوترات التي تم تطويرها خصيصًا للمهام التي تنفذها هذه الأنظمة ، والتي كانت (وما زالت في الغالب تشكل) قيدًا رئيسيًا في نجاح هذه الأنظمة. ونتيجة لذلك ، ذهب قدر كبير من الأبحاث إلى طرق للتعلم بشكل أكثر فعالية من كميات محدودة من البيانات.

وقد ركزت الأبحاث الحديثة بشكل متزايد على خوارزميات التعلم غير الخاضعة للإشراف وشبه الاشراف. هذه الخوارزميات قادرة على التعلم من البيانات التي لم يتم التعليق عليها يدويًا بالإجابات المطلوبة ، أو باستخدام مجموعة من البيانات المشروحة وغير المشروحة. بشكل عام ، هذه المهمة أكثر صعوبة من التعلم تحت الإشراف ، وعادة ما تنتج نتائج أقل دقة لمقدار معين من بيانات الإدخال. ومع ذلك ، هناك كمية هائلة من البيانات غير الموضحة (بما في ذلك ، ضمن أمور أخرى ، المحتوى الكامل لشبكة الويب العالمية) ، والتي يمكن أن تعوض في الغالب عن النتائج الأدنى إذا كانت الخوارزمية المستخدمة لديها فترة زمنية منخفضة بما فيه الكفاية ل يكون عمليا.

في عام 2010 ، أصبح تعلم التمثيل وأساليب التعلم الآلي العصبي الشبكي العميق على نطاق واسع في معالجة اللغات الطبيعية ، ويرجع ذلك جزئياً إلى سلسلة من النتائج التي تظهر أن هذه التقنيات يمكنها تحقيق نتائج متطورة في العديد من مهام اللغة الطبيعية ، على سبيل المثال في نمذجة اللغات ، والتحليل ، وغيرها الكثير. تتضمن التقنيات الشائعة استخدام تزايدات الكلمات لالتقاط الخصائص الدلالية للكلمات ، وزيادة في التعلم من مستوى إلى آخر لمهمة أعلى مستوى (مثل الإجابة على الأسئلة) بدلاً من الاعتماد على خط أنابيب للمهام الوسيطة المنفصلة (مثل ، تمييز جزء من الكلام وتعديل التبعية). في بعض المناطق ، استلزم هذا التحول تغييرات كبيرة في كيفية تصميم أنظمة البرمجة اللغوية العصبية ، بحيث يمكن النظر إلى المناهج القائمة على الشبكات العصبية العميقة كنموذج جديد متميز عن معالجة اللغات الطبيعية الإحصائية. على سبيل المثال ، يؤكد مصطلح الترجمة الآلية العصبية (NMT) على حقيقة أن النهج القائمة على التعلم العميق للترجمة الآلية تتعلم مباشرة التحولات من التسلسل إلى التسلسل ، مما يلغي الحاجة إلى خطوات وسيطة مثل محاذاة الكلمات ونمذجة اللغة التي استخدمت في الإحصاء الترجمة الآلية (SMT).

القاعدة القائمة على أساس البرمجة اللغوية العصبية الإحصائية
في الأيام الأولى ، تم تصميم العديد من أنظمة معالجة اللغات عن طريق ترميز اليدوي لمجموعة من القواعد ، على سبيل المثال عن طريق كتابة القواعد النحوية أو وضع قواعد إرشادية للنمو. ومع ذلك ، فإن هذا ليس قويًا بشكل عام لتنوع اللغة الطبيعية.

منذ “الثورة الإحصائية” المزعومة في أواخر الثمانينيات ومنتصف التسعينيات ، اعتمدت الكثير من بحوث معالجة اللغة الطبيعية بشكل كبير على التعلم الآلي.

يدعو نموذج التعلم الآلي بدلاً من ذلك إلى استخدام الاستدلال الإحصائي لتعلم هذه القواعد تلقائيًا من خلال تحليل مجموعة كبيرة من الأمثلة النموذجية في العالم الحقيقي (مجموعة (جمع ، “corpora”) عبارة عن مجموعة من المستندات ، ربما مع التعليقات البشرية أو الكمبيوترية ).

تم تطبيق العديد من الفئات المختلفة من خوارزميات تعلم الآلة على مهام معالجة اللغات الطبيعية. تأخذ هذه الخوارزميات كمدخل مجموعة كبيرة من “الميزات” التي يتم إنشاؤها من بيانات الإدخال. بعض من خوارزميات أقرب المستخدمة ، مثل أشجار القرار ، أنتجت أنظمة من القواعد الشديدة إذا تم ذلك مشابهة لأنظمة القواعد المكتوبة باليد التي كانت شائعة آنذاك. ومع ذلك ، فقد ركزت الأبحاث بشكل متزايد على النماذج الإحصائية ، التي تتخذ قرارات نزيهة احتمالية تستند إلى ربط الأوزان الحقيقية بقيمة كل سمة من سمات المدخلات. تتميز هذه النماذج بأنها قادرة على التعبير عن اليقين النسبي للعديد من الإجابات المحتملة المختلفة بدلاً من واحدة فقط ، مما ينتج عنه نتائج أكثر موثوقية عندما يتم تضمين هذا النموذج كمكون في نظام أكبر.

تتميز الأنظمة المستندة إلى خوارزميات تعلم الآلة بالعديد من المزايا عن القواعد اليدوية:

تركز إجراءات التعلم المستخدمة أثناء تعلم الآلة آليًا على الحالات الأكثر شيوعًا ، في حين أنه عند كتابة القواعد يدويًا ، لا يكون ذلك واضحًا على الإطلاق حيث يجب توجيه الجهد.
يمكن أن تستفيد إجراءات التعلم التلقائية من خوارزميات الاستدلال الإحصائي لإنتاج نماذج قوية مدخلات غير مألوفة (على سبيل المثال تحتوي على كلمات أو بنى لم يتم رؤيتها من قبل) ومدخلات خاطئة (على سبيل المثال ، مع الكلمات أو الكلمات التي بها أخطاء إملائية محذوفة عن طريق الخطأ). بشكل عام ، التعامل مع هذه المدخلات بأمان مع القواعد المكتوبة باليد – أو بشكل عام ، إنشاء أنظمة من القواعد المكتوبة بخط اليد والتي تجعل القرارات الناعمة – أمر بالغ الصعوبة ، وعرضة للخطأ وتستغرق وقتا طويلا.
يمكن جعل الأنظمة المستندة إلى تعلم القواعد تلقائيًا أكثر دقة بمجرد توفير المزيد من بيانات الإدخال. ومع ذلك ، لا يمكن جعل الأنظمة المستندة إلى قواعد مكتوبة بخط اليد أكثر دقة من خلال زيادة تعقيد القواعد ، وهي مهمة أكثر صعوبة. على وجه الخصوص ، هناك حد لتعقيد النظم القائمة على قواعد يدوية الصنع ، وبعد ذلك تصبح الأنظمة غير قابلة للإدارة بشكل متزايد. ومع ذلك ، فإن إنشاء المزيد من البيانات للإدخال إلى أنظمة التعلم الآلي يتطلب ببساطة زيادة مقابلة في عدد ساعات عمل الرجل ، وعمومًا بدون زيادات كبيرة في تعقيد عملية التعليق التوضيحي.

التقييمات والمهام الرئيسية
فيما يلي قائمة ببعض المهام الأكثر بحثًا في معالجة اللغات الطبيعية. لاحظ أن بعض هذه المهام لها تطبيقات حقيقية في العالم الحقيقي ، في حين أن البعض الآخر يعمل بشكل أكثر شيوعا كمهام فرعية تستخدم للمساعدة في حل مهام أكبر.

على الرغم من أن مهام معالجة اللغات الطبيعية متداخلة بشكل وثيق ، فإنها تنقسم في كثير من الأحيان إلى فئات من أجل الراحة. ويرد التقسيم الخشنة أدناه.

بناء الجملة

التحفيز النحوي
قم بإنشاء قواعد رسمية تصف بناء جملة اللغة.

Lemmatization

التجزئة المورفولوجية
كلمات منفصلة في morphemes الفردية وتحديد فئة من morphemes. تعتمد صعوبة هذه المهمة بشكل كبير على تعقيد التركيبة (أي بنية الكلمات) للغة قيد النظر. تحتوي اللغة الإنجليزية على مورفولوجيا بسيطة إلى حدٍ ما ، وخاصة مورفولوجيا انعطافية ، وبالتالي يمكن غالبًا تجاهل هذه المهمة تمامًا وببساطة تصميم جميع الأشكال الممكنة للكلمة (مثل “فتح ، فتح ، فتح ، فتح”) ككلمات منفصلة. في لغات مثل التركية أو Meitei ، وهي لغة هندية شديدة الالتصاق ، ومع ذلك ، فإن مثل هذا النهج غير ممكن ، حيث أن كل قاموس يحتوي على الآلاف من أشكال الكلمات الممكنة.

علامات جزء من الكلام
بالنظر إلى الجملة ، حدد جزء الكلام لكل كلمة. العديد من الكلمات ، خاصة الشائعة منها ، يمكن أن تكون بمثابة أجزاء متعددة من الكلام. على سبيل المثال ، يمكن أن يكون “الكتاب” اسمًا (“الكتاب على الطاولة”) أو فعل (“لحجز رحلة طيران”) ؛ “مجموعة” يمكن أن يكون اسم أو فعل أو صفة ؛ و “خارج” يمكن أن يكون أي من خمسة أجزاء مختلفة على الأقل من الكلام. بعض اللغات لديها مثل هذا الغموض أكثر من غيرها. [مشكوك فيها – مناقشة] اللغات ذات التشكل التصادمي الصغير ، مثل اللغة الإنجليزية ، عرضة بشكل خاص لهذا الغموض. الصينية هي عرضة لهذا الغموض لأنها لغة نغمية أثناء النطق اللفظي. لا يتم نقل مثل هذا الانعكاس بسهولة عبر الكيانات المستخدمة في التهجئة لنقل المعنى المقصود.

توزيع
حدد شجرة التحليل (التحليل النحوي) لجملة معينة. قواعد اللغة للغات الطبيعية هي غامضة والجمل النموذجية لها تحليلات متعددة ممكنة. في الواقع ، ربما يكون من المستغرب ، بالنسبة لجملة نموذجية ، أن يكون هناك الآلاف من التحليلات المحتملة (معظمها يبدو غير منطقي تمامًا للإنسان). هناك نوعان أساسيان من التحليل ، إعراب التبعية وتعميم الدوائر الانتخابية. يركز الإعتماد على العلاقات بين الكلمات في الجملة (وضع علامات على الأشياء مثل الأجسام الأولية والمسندات) ، في حين يركز Constituency Parsing على بناء شجرة التحليل باستخدام القواعد الاحتمالية الخالية من السياق (PCFG).

كسر الجملة (المعروف أيضًا باسم إزالة حدود الجملة)
بالنظر إلى جزء من النص ، ابحث عن حدود الجملة. غالبًا ما يتم تمييز حدود الجملة بنقاط أو علامات ترقيم أخرى ، ولكن هذه الأحرف نفسها يمكن أن تخدم أغراضًا أخرى (مثل وضع علامات الاختصارات).

النابعة
تجزئة الكلمات
افصل جزءًا من النص المستمر إلى كلمات منفصلة. بالنسبة للغة مثل اللغة الإنجليزية ، هذا أمر تافه إلى حد ما ، لأن الكلمات عادة ما تكون مفصولة بمسافات. ومع ذلك ، فإن بعض اللغات المكتوبة مثل الصينية واليابانية والتايلاندية لا تحدد حدود الكلمات بهذه الطريقة ، وفي هذه اللغات ، يعتبر تجزئة النصوص مهمة مهمة تتطلب معرفة مفردات الكلمات ومورفولوجيتها في اللغة. في بعض الأحيان يتم استخدام هذه العملية أيضًا في حالات مثل إنشاء حقيبة الكلمات (BOW) في تعدين البيانات.

استخراج المصطلحات
الهدف من استخراج المصطلحات هو استخراج المصطلحات ذات الصلة من مجموعة معينة.

دلالات

الدلالات المعجمية
ما هو المعنى الحسابي للكلمات الفردية في السياق؟

الترجمة الآلية
ترجمة النص تلقائيًا من لغة إنسانية إلى لغة أخرى. هذه واحدة من أصعب المشاكل ، وهي عضو في فئة من المشكلات التي يطلق عليها العامية “AI-complete” ، أي تتطلب كل أنواع المعرفة المختلفة التي يمتلكها البشر (قواعد اللغة ، علم الدلالة ، الحقائق حول العالم الحقيقي ، إلخ. .) من أجل حل بشكل صحيح.

التعرف على الكيانات المسماة (NER)
بالنظر إلى تدفق النص ، حدد العناصر الموجودة في الخريطة النصية إلى أسماء مناسبة ، مثل الأشخاص والأماكن ، ونوع كل اسم من هذا النوع (مثل الشخص أو الموقع أو المنظمة). لاحظ أنه على الرغم من أن الكتابة بالأحرف الكبيرة يمكن أن تساعد في التعرف على الكيانات المسماة بلغات مثل الإنجليزية ، فإن هذه المعلومات لا يمكن أن تساعد في تحديد نوع الكيان المسمى ، وعلى أي حال غالبًا ما تكون غير دقيقة أو غير كافية. على سبيل المثال ، يتم أيضًا تكبير أول كلمة في الجملة ، وغالبًا ما تمتد الكيانات المسماة إلى عدة كلمات ، وبعضها فقط مكتوب بحروف كبيرة. وعلاوة على ذلك ، فإن العديد من اللغات الأخرى في النصوص غير الغربية (مثل الصينية أو العربية) لا تملك أي رسملة على الإطلاق ، وحتى اللغات ذات الرسملة قد لا تستخدمها باستمرار لتمييز الأسماء. على سبيل المثال ، تستثمر اللغة الألمانية جميع الأسماء ، بغض النظر عما إذا كانت هذه الأسماء أم لا ، والفرنسية والإسبانية لا تستفيد من الأسماء التي تمثل صفات.

جيل اللغة الطبيعية
تحويل المعلومات من قواعد بيانات الكمبيوتر أو النوايا الدلالية إلى لغة بشرية يمكن قراءتها.

فهم اللغة الطبيعية
تحويل أجزاء من النص إلى تمثيلات أكثر رسمية مثل هياكل المنطق من الدرجة الأولى التي يسهل على برامج الكمبيوتر معالجتها. ينطوي فهم اللغة الطبيعية على تحديد الدلالة المقصودة من دلالات متعددة ممكنة يمكن أن تستمد من التعبير اللغوي الطبيعي الذي عادة ما يأخذ شكل مفاهيم منظمة لمفاهيم اللغة الطبيعية. مقدمة وخلق metamodel لغة وأنطولوجية فعالة مع حلول تجريبية. إضفاء طابع رسمي صريح على دلالات اللغة الطبيعية دون أي تداخل مع افتراضات ضمنية مثل افتراض العالم المغلق (CWA) مقابل افتراض العالم المفتوح ، أو من المتوقع أن يكون نعم / لا مقابل True / False موضوعي من أجل بناء أساس إضفاء الطابع الرسمي على دلالات الألفاظ .

التعرف الضوئي على الحروف (OCR)
بالنظر إلى صورة تمثل النص المطبوع ، حدد النص المقابل.

الإجابة على السؤال
بالنظر إلى مسألة لغة بشرية ، حدد إجابتها. الأسئلة النموذجية لها إجابة صحيحة محددة (مثل “ما هي عاصمة كندا؟”) ، لكن أحيانًا يتم النظر في الأسئلة المفتوحة (مثل “ما معنى الحياة؟”). نظرت الأعمال الحديثة إلى أسئلة أكثر تعقيدًا.

التعرف على النصب النصى
إذا أخذنا في الاعتبار جزأين من النص ، حدد ما إذا كان أحدهما صحيحًا يستلزم الآخر ، أو يستلزم نفي الطرف الآخر ، أو يسمح للآخر بأن يكون صحيحًا أو كاذبًا.

استخراج العلاقة
بالنظر إلى جزء من النص ، حدد العلاقات بين الكيانات المسماة (على سبيل المثال ، من هو المتزوج من).

تحليل المشاعر (انظر أيضا تحليل المشاعر المتعددة الوسائط)
استخرج المعلومات الشخصية عادة من مجموعة من الوثائق ، وغالبا ما تستخدم المراجعات عبر الإنترنت لتحديد “القطبية” حول كائنات محددة. ومن المفيد بشكل خاص لتحديد اتجاهات الرأي العام في وسائل الإعلام الاجتماعية ، لغرض التسويق.

تقسيم الموضوع والتعرف عليه
بالنظر إلى جزء من النص ، قم بفصله إلى شرائح كل منها مخصص لموضوع معين ، وحدد موضوع الشريحة.

كلمة معنى توضيح
كلمات كثيرة لها أكثر من معنى واحد. علينا أن نختار المعنى الأكثر منطقية في السياق. بالنسبة لهذه المشكلة ، عادةً ما نعطي قائمة بالكلمات وأحاسيس الكلمات المرتبطة بها ، على سبيل المثال من قاموس أو من مورد عبر الإنترنت مثل WordNet.

الحوار

تلخيص تلقائي
إنتاج ملخص قابل للقراءة لجزء من النص. غالبًا ما تستخدم لتقديم ملخصات لنص من نوع معروف ، مثل المقالات في القسم المالي لصحيفة.
قرار التجسيم

بالنظر إلى جملة أو جزء أكبر من النص ، حدد الكلمات (“الإشارة”) التي تشير إلى نفس الكائنات (“الكيانات”). يُعد حل Anaphora مثالًا محددًا لهذه المهمة ، وهو يهتم تحديدًا بمطابقة الضمائر بالأسماء أو الأسماء التي تشير إليها. تتضمن المهمة الأعم المتمثلة في حل المسائل الأساسية أيضًا تحديد ما يسمى “علاقات الجسور” التي تتضمن تعبيرات الإحالة. على سبيل المثال ، في جملة مثل “دخل منزل جون من خلال الباب الأمامي” ، “الباب الأمامي” هو تعبير محيّر وعلاقة الجسور التي يجب تحديدها هي حقيقة أن الباب المشار إليه هو الباب الأمامي لجون المنزل (بدلاً من بعض الهياكل الأخرى التي قد يشار إليها أيضًا).

تحليل الخطاب
يتضمن هذا النموذج عددًا من المهام ذات الصلة. تتمثل إحدى المهام في تحديد بنية الخطاب للنص المتصل ، أي طبيعة علاقات الخطاب بين الجمل (مثل التوضيح ، التفسير ، التباين). مهمة أخرى ممكنة هي التعرف على وتصنيف أعمال الكلام في جزء من النص (على سبيل المثال نعم ، لا سؤال ، سؤال المحتوى ، البيان ، التأكيد ، إلخ).

خطاب

التعرف على الكلام
بالنظر إلى مقطع صوتي لشخص أو أشخاص يتحدثون ، حدد التمثيل النصي للكلمة. هذا هو عكس النص إلى كلام وهي واحدة من المشاكل الصعبة للغاية التي يطلق عليها العامية “منظمة العفو الدولية كاملة” (انظر أعلاه). في الكلام الطبيعي لا يكاد يكون هناك أي توقف بين الكلمات المتعاقبة ، ومن ثم فإن تجزئة الكلام هي مهمة فرعية ضرورية للتعرف على الكلام (انظر أدناه). لاحظ أيضًا أنه في معظم اللغات المنطوقة ، تمتزج الأصوات التي تمثل الأحرف المتتابعة مع بعضها البعض في عملية تسمى التكرار ، لذلك فإن تحويل الإشارة التناظرية إلى أحرف منفصلة يمكن أن يكون عملية صعبة للغاية.

تجزئة الكلام
بالنظر إلى مقطع صوت لشخص أو أشخاص يتحدثون ، قم بفصله إلى كلمات. مهمة فرعية للتعرف على الكلام ويتم تجميعها عادةً.

النص إلى الكلام
في ضوء النص ، قم بتحويل تلك الوحدات وإنتاج تمثيل منطوق. يمكن استخدام تحويل النص إلى كلام لمساعدة ضعاف البصر.