أوجه ومستويات دعم اللغة العربية على الحاسوب

المستوى الأول : الإدخال والعرض

اتجاه الكتابة BiDi

تُعرض الحروف بتسلسل معين يتبع نمط اللغة. على سبيل المثال تخزن كلمة “المستقبل” في الملف النصي على الشكل التالي : “ل ب ق ت س م ل ا” ولكن عند عرضها ترسم من اليمين إلى اليسار على عكس اللغات اللاتنية، وتزيد الأمور تعقيدا عندما تتداخل النصوص العربية مع اللاتينية. لذلك تم ابتكار الخوارزمية المعروفة بـ Bi-Directional (BiDi)‎ واعتمدت مقاييسها في مرجع يونيكود Unicode. وتعرف يونيكود بالإضافة الى ذلك عدد من المحارف الإضافية والتي تتحكم بخوارزمية BiDi.

اتجاه واجهة الاستخدام RTL, LTR, TTB

تحدد هذه الخاصية عرض عناصر واجهة المستخدم في العربية والعبرية من اليمين إلى اليسار Right-To-Left (LTR)‎ وهي في اللغات اللاتينية من اليسار إلى اليمين Left-To-Right (LTR)‎ وهي في الصينية من الأعلى للأسفل Top-To-Bottom (TTB)‎.

اتجاه مؤشرة الكتابة Cursor

عملية تحريك المؤشرة تصبح معقدة عند التعامل مع اتجاهات الكتابة المختلفة في العربية واللاتينية. وهنال طريقتان لتحريك المؤشرة: المنطقية، حيث تتحرك المؤشرة بحسب تسلسل المحارف الفعلي. فعندما تكتب العربية تري أن وظيفة اسهم المؤشرة اصبحت معكوسة. والمرئية، حيث تتحرك المؤشرة بحسب عرض النض. وهذة هي الطريقة الفضلى.

إظهار التشكيل فوق الحروف وتداخل رسم المحارف والحروف Kerning

تحدد هذه الخاصية درجة تداخل الحروف والتشكيل ( والمحارف) بشكل عام عند العرض. وترتبط تفاصيل التداخل إجمالا بالخط نفسه. على سبيل المثال يجب أن يأتي التشكيل فوق أو اسفل الحرف مباشرة وليس بعده.

التدويل Internationalization (L18N)‎

التدويل هو القدرة العامة على إدخال النصوص وإظهارها بعدة لغات.

التحلية Localization (L10N)‎

التحلية هي ترجمة واجهة المستخدم ورسائل النظام ورسائل التطبيقات الموجهة للمستخدم.

ربط الأحرف

يحتاج اظهار الحروف في العربية الى عملية ربط للحروف. فشكل الحرف في بداية الكلمة يختلف عنه في وسطها أو أخرها ويختلف ايضا بحسب الحرف الذي قبله أو بعده.

اتجاهات الرموز

توفر الخطوط بصيغة تي تي إف True Type Font (TTF)‎

تعتبر صيغة تي تي إف الصيغة الأكثر نضجا وانتشارا لتمثيل الخطوط ومن ميزاتها الفريدة أنه يمكن استخدامها على كافة انظمة التشغيل المتدوالة : ويندوز أو ماك أو لينوكس ويونكس.

المستوى الثاني : التدقيق اللغوي والمساندة اللغوية

  • الاشتقاق والتصريف
  • التشكيل الآلي
  • الإعراب
  • التصحيح الإملائي
  • التصحيح الصرفي والنحوي
  • المعجم الحاسوبي و القاموس العربي - الإنجليزي
  • التوليد والاشتقاق

المستوى الثالث : طرائق التفاعل

يعنى هذا المستوي بطرائق التفاعل الاضافية مع اللغة العربية (بالإضافة الى لوحة المفاتيح والشاشة والطابعة).

قراءة النصوص المكتوبة على الورق : Optical Character Recognition (OCR)‎

تحويل الكلام المسموع إلى نص عربي حاسوبي : Automatic Sound Recognition (ASR)‎

تحويل النص العربي المحوسب إلى صوت مسموع ومفهوم : Text To Speach (TTS) or Speech Synthesizer

المستوى الرابع : الإدراك والفهم

توفر الذخيرة اللغوية Corpus

الدلالة و شجرة المعرفة

الترجمة الآلية Automatic Language Translation

المعالجة الآلية للغة : Natural Language Processing (NLP)‎

نقاش

muhandis, 2008/03/02 20:28

هل ثمة برامج التحليل الحاسوبي لبناء الذخيرة اللغوية العربية؟ ما هذه البرامج؟

مؤيد السعدي, 2008/03/03 15:52

وهل يجب أن ننتظر حتى يأتي مستشرق أو جامعة غربية لتقوم بذلك ؟ نحن هنا لنبنيها معاً، حلم جميل أليس كذلك! هذه ليست برامج جاهزة لكنها مصطلحات ومعايير يجب توفرها من أجل جعل الحاسوب يدرك العربية انظر http://en.wikipedia.org/wiki/Text_corpus أدنى تلك المستويات أن تتمكن من كتابة العربية وقرائتها وأعلاها أن يفهم الحاسوب العربية كما نفهمها نحن

abdo ali, 2008/04/13 20:24

البرامج المقدمة من IBM

abdo ali, 2008/04/13 20:27

كذلك برنامج الجوازات الذي ابتكره مبرمجين يمنيين

مؤيد السعدي, 2008/04/15 01:10

لم أفهم، ممكن تفصل مع ذكر روابط

هذه الصفحة تتحدث عن مصطحات يجب أن نعمل على توفيرها لدعم اللغة العربي

وهي على مستويات أقلها هو التمكن من الكتابة والقراءة

وأعلاها أن يتكمن الحاسوب من إدراك اللغة فترجم بينها وبين لغات أخرى أو يربط بين نصوص

لا يوجد رابط حرفي بينها

أدخل ملاحظتك (يسمح باستخدام صيغة الويكي):
إن لم تسطع قراءة الرموز، فبإمكانك تنزيل هذا المف الصويت والذي سقرأها لك.
دعم_العربية.txt · آخر تعديل: 2008/02/29 11:07 بواسطة alsadi
Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0

جميع حقوق النشر والتوزيع ممنوحة ضمن شروط رخصة وقف العامة.