الباحث/عبدالله حسان الأنصاري
مترجم بشركة STAR Group العالمية
المتخصصة في الترجمة الفنية والتكنولوجية
يونيو 2005
يهدف هذا البحث لتعريف أكبر قدر ممكن من الناس بأنواع حديثة من التقنيات تقدم الكثير من العون للناس في أعمالهم المختلفة، وخاصة الأعمال التي ترتبط بأجهزة الكمبيوتر وأيضا الأعمال التي تتداخل فيها اللغة مع أجهزة الكمبيوتر.
للوهلة الأولى قد يبدو للبعض أن هذا الموضوع بعيد بعض الشيء عن موضوع المؤتمر ولكن بعد أن ندقق بعض الشيء فيما يتضمنه هذا البحث من موضوعات سنجد أن هذه التقنيات المختلفة تمس العمل اليومي للمترجم في الصميم وتقدم له عونا كبيرا في عمله بشكل يجعل عمله أكثر راحة وأكثر سرعة إلى درجة تجعل المترجم الواحد بمفرده يستطيع إنجاز أعمال كانت تحتاج لأكثر من شخص يقوم بهذه الأعمال في وقت أقل وبدقة أكبر.
وهذا البحث يهدف لنشر الوعي بالكثير من الوسائل التي تتيحها التكنولوجيا الحديثة للتعامل مع اللغة بطرق جديدة توفر الجهد والوقت وتؤدي إلى نتائج أفضل لهذا العمل.
فهناك الكثير من التقنيات الحديثة الموجودة اليوم تسهل عمل الناس بشكل جذري وبطريقة مختلفة تماما ولكن غالبية المستخدمين العرب للأسف لا يعرفون شيئا عن هذه التقنيات ومقدار الجهد والوقت الذي يمكنهم توفيره باستخدام هذه التقنيات واسعة الانتشار بين غير العرب، وذلك رغم أن معظم هذه التقنيات تتوافر للغة العربية.
فهذا البحث يهدف إلى جعل عمل المترجمين خاصة والناس بصفة عامة أكثر سهولة مما يوفر وقتهم وجهدهم.
ونظرا لأن المؤتمر موضوعه الأساسي هو ترجمة فإن هذا البحث يركز أيضا على الترجمة وتقنيتها المتمثلة في الترجمة الآلية وذاكرة الترجمة، ويلي ذلك عدد من التقنيات الأخرى.
مقدمة:
هناك العديد من المجالات اللغوية التي لها تطبيقات قائمة على البرامج الإلكترونية في الأجهزة وخاصة أجهزة الكمبيوتر، وتسمى هذه المجالات “معالجة اللغة الطبيعية” (Natural Language Processing – NLP).
ونظرا للأهمية الكبيرة لهذه المجالات والفوائد الكثيرة المرتبطة بتطبيقات هذه المجالات اللغوية التي تدخل في الحياة اليومية للأفراد وفي الأعمال التجارية للشركات، فإن هناك العديد من الشركات في العالم التي تتنافس فيما بينها في مجال أبحاث وتطبيقات برامج معالجة اللغة الطبيعية التي تتعامل مع مختلف اللغات، ومنها شركات عديدة تدخل اللغة العربية ضمن اهتمامها ولها منتجات خاصة باللغة العربية.
وسنندهش بشدة حينما نعرف أن من أهم الشركات التي تعمل في أبحاث وبرامج مجال اللغة العربية عدة شركات أجنبية، مثل شركة زيروكس الشهيرة بمنتجاتها من ماكينات التصوير، وشركة فيليبس الهولندية، إلى جانب الشركات الأخرى المعروفة بتخصصها في هذه المجالات، فهناك مثلا شركة مايكروسوفت بكل إمكانياتها وبرامجها المعروفة، وشركة صخر العربية التي تعبر من أقوى الشركات في مجالات اللغة العربية، وشركة IBM التي تعد من الرواد في مجال الكمبيوتر وتطبيقاته المختلفة، وشركة كولتك الموجودة في القاهرة والتي تعتبر من الشركات الحديثة نسبيا حيث بدأت نشاطها في الثمانينيات، وشركة ATA الموجودة في لندن، وشركة CIMOS الفرنسية، وغيرها من الشركات…….. الخ. وهذا العدد الكبير من الشركات يوضح لنا مدى الاهتمام بهذه المجالات اللغوية نظرا للطلب الكبير حاليا وفي السنوات القادمة على البرامج والتطبيقات اللغوية، وهذا يعني أرباحا طائلة منتظرة من وراء الاستثمارات الهائلة التي تدفعها هذه الشركات منذ سنوات لتحجز لنفسها نصيبا من هذه النوعية من المنتجات التي ستشكل جزءا أساسيا من الحياة اليومية لكثير من الناس في المستقبل القريب جدا.
وتشتمل مجالات معالجة اللغة الطبيعية على عدة موضوعات رئيسية منها:
- برامج الترجمة الآلية (ترجمة نصوص كاملة آليا)،
- برامج ذاكرة الترجمة (تخزين واستعادة الترجمات البشرية)،
- برامج المعالجة الآلية للكلام (التعرف الآلي على النطق)،
- برامج المعالجة الآلية للكتابة (التعرف الآلي على النصوص المكتوبة، وتحويلها لنصوص منطوقة)،
- برامج المعاجم الآلية (القواميس الإلكترونية لترجمة الكلمات)،
- برامج المعالجة الآلية للبيانات (الأرشفة والفهرسة الآلية والنشر الإلكتروني)،
المعالجة الآلية للكتابة:
وتنقسم إلى مجالين:
- تحويل النصوص إلى كلام منطوق،
- التعرف الضوئي على الحروف،
تقنية تحويل النصوص إلى كلام TTS
تعريف:
يقصد بتقنية تحويل النصوص إلى كلام (Text To Speech – TTS) قيام أحد الأجهزة (من خلال برنامج على جهاز الكمبيوتر مثلا) بمحاكاة النطق البشري من خلال قراءة نص مكتوب وتحويله إلى كلام منطوق (أي أن البرنامج يقوم بتوليد النطق الصوتي لكلمات النص المكتوبة).
وتنقسم برامج توليد الكلام إلى نوعين أساسين هما:
- نظم المفردات المحدودة: تستخدم لنطق كلمات معينة سبق تحليلها وتخزينها على هيئة رموز وإشارات صوتية، مثل تلك البرامج المستخدمة في الأجهزة التعليمية الناطقة التي تقوم بنطق أسماء بعض الحيوانات أو الألوان مثلا، والبرامج الموجودة في السيارات لتنبيه السائق لربط حزام المقعد، أو لإسماعه الرسائل المكتوبة التي تصل له من جهاز الملاحة المرتبط بالأقمار الصناعية.
وتتميز هذه الأنظمة بوضوح نطقها، ولكن يعيبها طاقاتها المحدودة في تخزين ونطق المفردات؛ حيث إنها لا تستطيع سوى نطق
الكلمات المخزنة فيها مسبقا.
- نظم المفردات غير المحدودة: لديها القدرة على تحويل أي نص – دون الاقتصار على كلمات معينة – إلى كلام منطوق سواء تم إدخاله من لوحة مفاتيح، أو باستخدام الماسح الضوئي (السكانر) مع برامج التعرف الضوئي على الحروف (OCR) التي نتناولها في جزء خاص بها، بل إن أحد البرامج المتقدمة (برنامج “إبصار” من إنتاج شركة صخر) بإمكانه أن يقرأ للمستخدم ضعيف البصر أو الكفيف أي نص موجود حتى على شاشة الكمبيوتر أو شاشة هاتفه المحمول سواء باللغة العربية أو الإنجليزية.
كيف تعمل برامج تحويل النصوص إلى كلام؟
تعتبر تقنية تحويل النصوص إلى كلام من التقنيات اللغوية المتقدمة؛ حيث إن إنتاجها يتطلب خبرة ودراية أولا بمجال اللغة لأن هذه التقنية تعتمد بصورة رئيسية على عدة فروع ومجالات لغوية، مثل علوم النحو والصرف والأسلوب والبلاغة والصوتيات. كما أنها تتطلب في نفس الوقت أبحاثا واسعة ودراية كاملة بمجالات معالجة اللغات الطبيعية (Natural Language Processing – NLP)، واللغويات الحاسوبية – أي المجالات التي تجمع بين اللغة والحاسب الآلي- بالإضافة إلى عدد آخر من علوم الكمبيوتر والبرمجة.
وتتكون برامج هذه التقنية من ثلاث وحدات رئيسية:
- الوحدة الأولى: وهي الجـزء اللغوي في البرنـامج الذي يقـوم بتحليل الجوانب النحوية والصرفية في النص المكتوب، وذلك من خلال السياق، ثم يقوم بعد ذلك بتحويل كل كلمة من النص المكتوب إلى مجموعة من الرموز التي تمثل مكونات النص، ولكن بصيغة توصيف صوتي (Transcription) لتتعامل الوحدة الثانية مع هذه الرموز الصوتية.
- الوحدة الثانية: وهي الجزء الحسابي في البرنامج الذي يقوم اعتمادا على التوصيف الصوتي (Transcription) الذي أنتجته الوحدة الأولى بحساب قيم ومتغيرات الكلام المنطوق الذي سيتم تكوينه في الوحدة الثالثة.
- الوحدة الثالثة: وهي الجزء الذي يقوم بتخليق الصوت (أي نطق النص) بناء على القيم والمتغيرات التي تم تحديدها في المرحلة السابقة ليصدر الصوت المنطوق بالكلمات التي يسمعها مستخدم البرنامج بصوت يقارب الصوت البشري.
خصوصية اللغة العربية:
وفي حالة اللغة العربية بالذات فإنه من المستحيل توليد الكلام المنطوق من النص المكتوب دون أن يتم تشكيل النص المكتوب أولا؛ وذلك لأن هناك الكثير من الكلمات في اللغة العربية التي تتماثل أو تتشابه في الشكل ولكنها تختلف في المعنى حسب التشكيل أو موقعها في السياق الذي وردت فيه.
وهذا هو ما يقوم به مثلا برنامج المُشكل الآلي – الذي يعد أحد أقوى إنجازات شركة صخر في معالجة اللغة العربية – حيث يعتبر التشكيل خطوة أساسية للتعامل مع النصوص التي تكون في معظم الأحوال بدون تشكيل. فيقوم المشكل الآلي في البداية (في المرحلة اللغوية) بتشكيل النص؛ حتى يمكن أن يتم تحديد التوصيف الصوتي له بطريقة صحيحة، ليدخل بعد ذلك في وحدة التخليق الصوتي لتوليد النص المناسب. وكل هذه العمليات والمراحل تتم بسرعة فائقة في أجزاء من الثانية ولا يشعر المستخدم بها رغم أن هذه العملية وراءها سنوات طويلة من الأبحاث والتجارب والمجهودات.
التطبيقات:
تعتبر تقنيات تحويل النصوص إلى كلام من التقنيات المستقبلية التي يتوقع لها المزيد من الانتشار في العديد من المجالات مثل قراءة رسائل البريد الإلكتروني، وبرامج الوسائط المتعددة، مثل البرامج التعليمية والترفيهية للأطفال والكبار، والأهم من ذلك تلبية احتياجات المعاقين كالمكفوفين مثلا ليتمكنوا من استخدام الكمبيوتر والإنترنت، ومن التعلم والإطلاع على الكتب والرسائل مما يتيح لهم مدى أكبر بكثير في مجالات الدراسة والتواصل مع الآخرين. كما يوفر لهم أيضا ميزة مهمة للغاية تتمثل في الحفاظ على خصوصيتهم؛ فهم ليسوا بحاجة مثلا لمن يقرأ لهم رسائلهم أو كتبهم، بل إن نفس البرنامج يمكن أن يستخدمه شخص أمي لا يعرف القراءة وذلك بدلا من أن يلجأ لمن يقرأ له خطاب ما، أو حتى مستند مهم قبل أن يوقع عليه مثلا دون أن يعرف مضمونه. وفيما يلي أمثلة لتطبيقات تقنية تحويل النصوص إلى الكلام (TTS):
- الكتب والمستندات الناطقة للمكفوفين،
- الأجهزة الناطقة مثلا لضعاف السمع أو لتعليم الأطفال، أو الكبار كبرامج نطق اللغات الأجنبية،
- أنظمة الملاحة والتحكم الموجودة في السيارات الحديثة؛ حيث يقوم نظام الملاحة بنطق الأوامر فيسمعها السائق دون أن يضطر للنظر إلى الشاشة والانشغال عن الطريق،
- أجهزة الهاتف التي يتم تسجيل أسماء بعض الأشخاص وأرقامهم فيها، ويمكنها بعد ذلك عند ورود مكالمة أن تقوم بنطق اسم الشخص ورقمه إذا كانا مسجلين، أو تقوم بنطق الرقم فقط إذا لم يكن هناك اسم مسجل لهذا الرقم.
- ولن يكون غريبا أن نجد مديرا يستمع إلى تقرير وصل إليه بينما يفعل شيئا أخرا، أو ربة منزل تستمع للجريدة أثناء إعدادها للطعام دون أن تحتاج لأن تمسك الأوراق بيديها لتقرأها بعينيها!
مثال لكيفية إسهام تقنية النطق الآلي للنصوص في توفير المال والوقت
تزداد أهمية تقنية النطق الآلي للنصوص بحيث لا يمكن الاستغناء عنها في بعض الأعمال التي تحتاج لتزويد عملائها بأحدث المعلومات الضرورية فورياً وعلى مدار 24 ساعة بصرف النظر عن مواعيد العمل أو الأجازات. وعادة ما تستخدم تلك الشركات أنظمة الاستجابة الصوتية التفاعلية (IVR)ومراكز تلقي المكالمات لتوصيل تلك المعلومات لعملائها. إن عملية تحويل البيانات الحيوية المخزنة في مواقع الإنترنت وقواعد البيانات والملفات إلى صوت طبيعي باستخدام الأسلوب التقليدي المكلف والمهدر للوقت المتمثل في إجراء تسجيلات بالصوت البشري في استوديوهات، عملية صعبة وتستغرق وقتاً طويلاً، وذلك لأن المعلومات عادة ما تتغير باستمرار، وقد يستحيل مواكبة هذه التغيرات باستخدام أسلوب التسجيلات الصوتية. وبالتالي يصبح وجود أحد برامج نطق النصوص بأكثر من لغة هو الحل المناسب لمعالجة المعلومات المخزنة في أنظمة الاستجابة الصوتية التفاعلية (IVR) ومراكز تلقي المكالمات.
ولنا أيضا أن نتخيل إمكانية استخدام نفس الأنظمة في المؤسسات الخدمية التي يحتاج عدد كبير من المتعاملين معها لمعرفة بيانات أو معلومات بصورة مستمرة، مثل إحدى الشركات العاملة في مجال البورصة والأوراق المالية ليتابع العملاء تطورات السعار، أو حتى في المدارس والجامعات كطريقة لإبلاغ الطلاب بالنتائج عن طريق الهاتف دون الحاجة لوجود شخص بشري للرد على هذا العدد الذي قد يصل لآلاف المكالمات، وذلك بدلا من توافد الطلاب على الجامعة أو المدرسة لمعرفة النتيجة.
التعرف الضوئي على الحروف OCR
تعريف:
هي تقنية تجعل البرامج تقوم بتحويل المستندات التي يتم مسحها ضوئيا من مجرد صورة لا يمكن تعديل محتوياتها بسهولة إلى نص يمكن تعديله والتحكم فيه، أي أن برامج التعرف الضوئي على الحروف تقوم بقراءة المستند من الورق ثم كتابته آليا. وتسمى برامج التعرف الضوئي على الحروف (Optical Character Recognition – OCR).
عند عمل مسح ضوئي لأي مستند يحتوي على نص مكتوب (باستخدام الماسح الضوئي – السكانر)، فإن الكمبيوتر كان في السابق يتعرف على هذا النص كصورة أي ككتلة واحدة لا يمكن إجراء أي تعديل فيها أو الاستفادة من النص الموجود فيها (أي كأنه صورة للمستند تم تصويرها بكاميرا فوتوغرافية)، فكان لا يمكن للمستخدم معالجة نص مخزن في صورة أو البحث فيه أو تعديله. أما مع برامج التعرف الضوئي على الحروف فقد تغير الأمر تماما، وأصبح بالإمكان أن يقوم المستخدم بتحويل كتاب كامل إلى نصوص مكتوبة على الكمبيوتر يمكن التحكم فيها وتعديلها بكل الطرق المتاحة، بدلا مما كان يحدث سابقا من ضرورة قيام شخص ما بكتابة هذا الكتاب أو المستند بنفسه على لوحة المفاتيح من جديد مما كان يستغرق وقتا وجهدا وتكلفة كبيرة.
أما الآن وخاصة مع بعض أجهزة الماسح الضوئي المزودة بوحدة لتقليب صفحات الكتب فيمكن أن يتم تحويل كتاب من مئات الصفحات في وقت قصير إلى ملفات على الكمبيوتر تحتفظ حتى بنفس شكل وتنسيق المستند الأصلي، مما يجعل هذه التقنية تفتح الباب مثلا أمام تحويل أي قدر من التراث والإبداع البشري القديم والحديث في الكتب إلى صورة ملفات كمبيوتر يمكن مثلا نشرها على الإنترنت أو تداولها بأي شكل من الأشكال وبمجهود قليل. وهناك حاليا مشروع لتحويل محتويات مكتبة الأزهر إلى صورة رقمية باستخدام أحد برامج التعرف الضوئي على الحروف لنشرها على الإنترنت. مما سيتيح للجميع الإطلاع على مخطوطات مكتبة الأزهر القديمة التي يعود بعضها إلى أكثر من 1800 عام، حيث كانت المكتبة تحرص على تخزينها بعيداً عن مرأى رواد المكتبة، في حين كان يسمح لطلاب الأزهر فقط الوصول إليها. أما الآن فقد غدا بإمكان المهتمين الوصول إلى مكتبة الأزهر مباشرة عبر الإنترنت. حيث يتم الآن مسح ما يقارب 52 ألف مخطوطة وأكثر من 120 ألف مطبوعة.
كيف تعمل برامج التعرف الضوئي على الحروف؟
تعتمد هذه التقنية على قيام البرنامج بفحص الصورة التي يتم إدخالها إليه من الماسح الضوئي أو الصورة المخزنة من قبل على الكمبيوتر، ثم يبدأ البرنامج في محاولة تمييز كل حرف من الحروف ومقارنته بما هو مسجل لديه من حروف، وعادة تكون هذه البرامج مزودة بقواميس للغات التي تستطيع التعامل معها لتقارن كل كلمة بالكلمات المخزنة في القاموس الخاص بكل لغة. ثم يقوم البرنامج بعد ذلك بحفظ كلمات النص في ملف مثل ملف Word ليكون بذلك قد تم تحويل الصورة التي تم إدخالها إلى نص. وتكون دقة التعرف على النص في هذه الحالة تقترب من 99% في بعض هذه البرامج.
والبرامج المتقدمة في هذا المجال يمكنها أيضا التعرف على الجداول الصور وعلى بقية عناصر تنسيق الصفحة ونقلها إلى المستند النهائي، وذلك يكون قد تم تحويل المستند الأصلي إلى مجموعة مطابقة من الملفات التي يمكن الاستفادة منها بعد ذلك بأي شكل من الأشكال.
وهناك عدة شركات في العالم تقوم بعمل أبحاث وبإنتاج هذه البرامج مثل صخر في القاهرة (برنامج القارئ الآلي) للغة العربية، وزيروكس في فرنسا (برنامج TextBridge) أو ABBY في روسيا (برنامج Fine Reader) للغات الأجنبية.
صعوبات خاصة باللغة العربية:
تتميز اللغة العربية بتشابك الحروف، حيث تتصل الحروف مع بعضها لتكون ما نسميه “مجموعات حروف مترابطة”، كما يمكن كتابة اللغة العربية بالعديد من الخطوط، وبالتالي يصبح لكل “مجموعة حروف مترابطة” أكثر من شكل. إلى جانب ذلك، تستخدم اللغة العربية أنواعاً متعددة من العناصر الخارجية مثل النقاط والهمزات والمد.
وهناك أيضاً التشكيل الذي يضيف مجموعة جديدة من العناصر الخارجية، علاوة على أن شكل الحروف العربية يتغير حسب موقعها
داخل مجموعة الحروف المترابطة (في البداية أو الوسط أو النهاية أو منفردة).
كما أن تداخل الحروف يزيد من صعوبة تحديد المسافة الفاصلة بين مجموعات الحروف المترابطة والكلمات. وأخيراً، لا يتبع منتجو
الخطوط العربية معياراً واحداً. وبعد أن تعرفنا على الخصائص الفريدة للخطوط العربية وخواص اللغة العربية، نستطيع أن ندرك مدى الصعوبات التي كانت تواجه إنتاج برامج للتعرف على حروف اللغة العربية، وذلك بعكس اللغات الأوربية مثلا التي تكتب بحروف متفرقة وليس بها تشكيل والخطوط المستخدمة فيها ذات معايير أكثر ثباتا مما يسهل مهمة برامج التعرف على الحروف عند التعامل مع تلك اللغات.
وذلك يجعلنا ندرك مدى الجهد الذي يتم بذله والخبرات اللازمة في البرامج التي تتعامل مع اللغة العربية، ومن أنجحها برنامج القارئ الآلي
الذي يستطيع التعامل مع اللغة العربية بكفاءة تصل إلى 99.8%، بالإضافة إلى وجود نسخة منه تحتوي أيضا على برنامج TextBridge المتميز من زيروكس مما يجعله قادرا على التعامل مع 19 لغة عالمية مختلفة بكفاءة.
كما يمكن للبرنامج التعرف على حروف اللغة العربية والإنجليزية معاً في نفس الصفحة. علاوة على ذلك، يستطيع القارئ الآلي التمييز بين 26 نوع خط TrueType عربياًّ.
يتعرف البرنامج على الصور ويضعها في موقعها المناسب في الصفحة، كما يحفظ تنسيق الصفحة دون إجراء أي تعديلات على الجداول أو الأعمدة أو الصور، ويمكنه كذلك التعرف على علامات التشكيل وإبقاؤها أو إزالتها حسب رغبة المستخدم.
وتأتي جميع أجهزة الماسح الضوئي حاليا مزودة ببرامج مجانية أو تجريبية للتعرف الضوئي على الحروف مع أكثر من لغة مثل برنامج Fine Reader من إنتاج شركة ABBY الروسية والذي يمكنه التعرف على ما يزيد عن 30 لغة مختلفة، وإن كان لا يتعرف على أكثر من لغة واحدة في الصفحة الواحدة، أي لابد أن تكون الصفحة بكاملها بنفس اللغة، وإلا ستظهر الأجزاء التي تحتوي على لغة أخرى غير اللغة المحددة للبرنامج ليتعرف عليها كمجرد رموز غير مفهومة أو كصورة في أحسن الأحوال.
المعالجة الآلية للكلام SR
تعريف:
هي برامج للتعرف الآلي على الكلام المنطوق (Speech Recognition – SR)، ويتم في غالبيتها تحويل الكلمات المنطوقة إلى نصوص مكتوبة. فيقوم المستخدم مثلاً بمجرد التحدث في الميكرفون المتصل بالكمبيوتر ليقوم البرنامج بتحويل كلامه إلى نص مكتوب.
وهناك العديد من الشركات التي تعمل في هذا المجال بالنسبة للغة العربية، ومنها صخر وIBM وفيليبس، (وهناك أيضا شركة Dragon، وغيرها تتخصص في لغات أخرى).
كيف تعمل برامج المعالجة الآلية للكلام؟
تعتمد فكرة عمل برنامج التعرف الآلي على الكلام على تخزين مجموعة كبيرة جدا من النصوص كجمل متكاملة داخل البرنامج، مع تغذية البرنامج بنماذج مختلفة للنبرات وطرق نطق الأشخاص المختلفين بحيث يمكن للبرنامج بعد ذلك التعرف على هذه الكلمات عندما يقوم الشخص بنطقها. حيث إن البرنامج يحاول التعرف على كل كلمة بمفردها من كلمات المتحدث ومقارنتها بأقرب كلمة مسجلة لديه حيث يحاول البرنامج من خلال النصوص المخزنة فيه توقع السياق الذي يتحدث فيه الشخص المتكلم واستنتاج الكلمات التالية التي قد ينطقها، إلا أن هذا لا يمنع قدرة بعض هذه البرامج على كتابة أي كلمة قد تختلف عن السياق المسجل بداخلها.
ولذلك فإن فكرة هذه البرامج تعتمد على محاولة تخزين نوعيات من النصوص تكون ملائمة لأكبر عدد من المستخدمين وشائعة الاستخدام في الحياة اليومية حتى تفي بمتطلبات معظم المستخدمين، كما أن هذه البرامج تحتوي على إمكانية إضافة كلمات جديدة للكلمات المخزنة بداخلها، وبذلك يتمكن كل مستخدم من جعل البرنامج يتواءم أكثر مع احتياجاته. بالإضافة إلى أن البرنامج يقوم باستمرار بتحسين قدرته على التعرف على كلام المستخدم وطريقة نطقه، مما يؤدي بعد فترة لزيادة قدرته في التعرف على الكلام بصورة واضحة، وبدقة تصل إلى نسبة تتراوح ما بين 80 % 98 %. ويحتاج المستخدم بعد ذلك للقيام بمراجعة النص بدقة وتصحيح أي كلمات غير صحيحة، فيقوم البرنامج من خلال هذا التصحيح بتحسين تعرفه على طريقة نطق هذا المستخدم مع الوقت وبالتالي تتحسن دقة الإملاء وسرعة العمل بالبرنامج.
وتعد هذه التقنية من التقنيات الحديثة الواعدة التي تحقق فعلا توفيرا كبيرا في الوقت والجهد، وما تزال تبشر بالكثير؛ حيث أتاحت التقنية الحديثة العديد من الأجهزة والبرمجيات القادرة على نوع من “فهم” الكلام البشري والقيام بتنفيذ مهام معينة بسرعة بدلا مما كان يحدث سابقا من ضرورة قيام الإنسان بإعطاء هذه الأوامر أو تنفيذها بطريقة يدوية تحتاج لوقت ومجهود، وقد لا تعطي نفس الدقة.
وهذا المجال له حاليا تطبيقات كثيرة نذكر أمثلة قليلة منها فيما يلي:
التطبيقات:
- الإملاء:
حيث لم يعد الإنسان يحتاج لكتابة المستندات – طالت أو قصرت – باستخدام لوحة مفاتيح الكمبيوتر والفأرة بصوت المستخدم، بل أصبح يكفي الجلوس مسترخيا أمام الجهاز وإملاء النص الذي يريد كتابته بالصوت، وكذلك جميع الأوامر الخاصة بتنسيق النص، مما يوفر جهدا ووقتا ثمينا لا يعرف قيمته الحقيقية إلا من قضى ساعات طوال منكبا على لوحة مفاتيح الآلة الكاتبة أو حتى الكمبيوتر لكتابة العديد من الصفحات ومتنقلا بعينيه بين الأزرار والشاشة والورق الذي ينقل منه النص المراد كتابته.
- التحكم بالصوت في الحاسب والإنترنت:
وهو تطبيق يتيح إلى حد كبير الاستغناء عن الحاجة لاستخدام اليدين مع لوحة المفاتيح والفأرة أثناء التعامل مع العديد من برامج والتطبيقات الحاسب وتصفح الإنترنت وإرسال واستقبال البريد الإلكتروني، كما تجري حاليا تجارب لإدخال نفس الطريقة للتعامل مع آلات أخرى عديدة.
- الاستماع للمعلومات من البريد الصوتي:
حيث يمكن للشخص الاتصال بهاتف منزله من الخارج – أو بصندوق بريده الصوتي بالهاتف المحمول – والاستفسار عن الرسائل الصوتية التي وصلته في أثناء غيابه، وذلك باستخدام صوته.
وبالنسبة لبرامج التعرف على الكلام الموجودة حاليا فقد طرحت شركة IBM منذ عدة سنوات (1998) منتجها ViaVoice الذي يباع كمنتج مستقل، في حين تقدم صخر نظاما للتعرف على الكلام يباع مدمجا ضمن منتجات أخرى مثل “إبصار” للمكفوفين ونظام الرد على المكالمات.
ويتميز نظام صخر بأنه غير مرتبط بمستخدم محدد بل يمكنه التعرف على كلام أي شخص بعدة لهجات، في حين أنه في نظام IBM لا بد من تدريب البرنامج أولا على صوت المستخدم.
ويحتوي برنامج IBM على معجم به حوالي 500000 كلمة، في حين يحتوي برنامج صخر على 100000 كلمة، وكلا النظامين يمكن زيادة محتواه من خلال إضافة المفردات الخاصة بكل مستخدم على حدة.
وتجدر الإشارة إلى أن معظم أجزاء هذا البحث قد تم إملاؤها باستخدام أحد برامج التعرف الآلي على الكلام.
وهناك أيضا شركة فيليبس التي أنشأت مركزا متكاملا لجمع نماذج صوتية للنطق العربي في مشروع اسمه أورين تل
(Orien tel) يموله الاتحاد الأوربي، وتستعين فيليبس المشرف الرئيسي على المشروع بمركز الاتصال في إحدى مؤسسات الاتصالات لتجميع عينات صوتية من اللهجات العربية المختلفة، مثل لهجات منطقة الخليج ومصر، حيث سيتم آلياً تمييز كل نبرة من اللهجات العربية
لإنتاج برنامج جديد متميز للتعرف على الكلام العربي بلهجات مختلفة دون أن يقتصر على اللغة الفصحى فقط كما هو الحال مثلا في برنامج ViaVoice. وكان من المفترض أن يظهر هذا البرنامج في صيف 2003، إلا أنه لم ير النور بعد على حد علمي.
الترجمة:
قبل أن نتحدث عن موضوع الترجمة الآلية والترجمة بمساعدة الآلة نحتاج أولا لأن نبحث بسرعة ماهية عملية الترجمة بصفة عامة حتى يمكن بعد ذلك أن ندرك بوضوح فكرة الترجمة الآلية وأهميتها ومستوى النتائج التي يمكن أن ننتظرها من الأجهزة وخاصة الكمبيوتر في هذا المجال، وأيضا حتى يمكننا تقييمها بموضوعية.
الترجمة:
الترجمة هي عملية نقل نص من لغة كالإنجليزية مثلا إلى لغة أخرى كالعربية مثلا.
ويكون النص الُمترجَم مثاليا، إذا نجح المترجم في أن ينقل للشخص الذي يقرأ الترجمة نفس المعاني والتأثيرات التي كانت ستصل إليه لو كان يقرأ النص الأصلي مباشرة وليس نصا مترجما؛ أي إذا نجح المترجم في الحفاظ على:
- المعاني،
- التأثير على المتلقي،
- الألفاظ المستخدمة.
و”فن الترجمة” يتمثل في الحفاظ على هذه العناصر مجتمعة أو على أكبر قدر ممكن منها؛ لكنه في أغلب الأحيان ونظرا لاختلاف طبائع اللغات يضطر المترجم للتخلي عن أحد هذه العناصر وخاصة عنصر الكلمات، ولكن على الأقل يجب الحفاظ على المعنى الذي يحمل لغة نص الأصلي؛ لأن الترجمة إذا لم تنجح في نقل المعنى فقدت كل لا قيمة لها. فبقدر الحفاظ أو عدم الحفاظ على هذه العناصر يكون تقييم مدى نجاح الترجمة.
ويتوج عملية الترجمة ويجعلها رفيعة المستوى أن المتلقي حينما يتلقى النص المترجم لا يستشعر كونه مترجما، بل يظن أنه نص كتب أو قيل بلغته هو ولا يجد فيه غرابة. وعملية الترجمة عامة ورفيعة المستوى خاصة ليست أمرا سهلا كما يتصور البعض أنها “لا تتطلب أكثر من فتح القاموس واستخراج معاني كلمات النص”، بل إن عملية الترجمة التي تتم داخل عقل المترجم تنطوي في كثير من الأحيان على عناء وإرهاق ذهني شديدين للوصول إلى نص مترجم يحمل بدقة عناصر النص الأصلي، ويصوغه باللغة التي يتم الترجمة إليها صياغة سلسة وجميلة. وهذا العمل العقلي أشبه بعملية ترجمة داخلية أو ترجمة أولية يقوم المترجم خلالها بتحليل النص، وبناء على فهمه له يبدأ في اختيار الكلمات المناسبة والسياق الملائم لنقل هذا النص إلى اللغة الأخرى.
وخلاصة هذا الكلام أن طبيعة الإنسان، وقدرته على الفهم، وطريقة تفكيره، وثقافته، وإبداعاته الذاتية، بل وعواطفه، وسماته الشخصية تنعكس ولا بد على الترجمة؛ ولذلك نجد في كثير من الأحيان اختلافات واضحة في ترجمات أكثر من شخص لنفس النص. وهذه الاختلافات تجعل الترجمة البشرية ذاتها موضع تساؤل من حيث مدى دقتها.
الترجمة الآلية MT
تعريف:
يقصد بتقنية الترجمة الآلية (Mashine Translation – MT) قيام أحد البرامج الآلية (على جهاز الكمبيوتر مثلا) بترجمة النصوص سواء المكتوبة أو المنطوقة من إحدى اللغات إلى لغة أخرى. حيث يتم إدخال نص باللغة الإنجليزية مثلا فيقوم البرنامج في ثواني معدودة أو حتى في أجزاء من الثانية بترجمته إلى اللغة العربية مثلا.
وتهدف الترجمة الآلية إلى توفير الوقت الكثير والمجهودات الكبيرة التي يحتاجها المترجم البشري بالإضافة إلى الاستفادة من الإمكانيات الهائلة للأجهزة وقدرتها على تخزين الترجمات التي تتم للاستفادة بها فيما بعد بأي شكل آخر.
من المعروف لنا أن حاجة البشر للترجمة بين اللغات أمر قديم قدم التاريخ كضرورة أساسية لعملية التواصل بين البشر على اختلاف لغاتهم، لذلك وجد المترجمون منذ قديم الزمان وعرفوا باسم الترجمان.
ومع مرور الزمن وتطور الحياة وانفتاح العالم على بعضه ازدادت الحاجة للترجمة بشدة. لذلك اتجه التفكير منذ أمد بعيد لمحاولة لاستخدام طرق آلية للقيام بمهمة الترجمة، وقامت أول آلة بالترجمة في عام 1930. وفي بداية الخمسينيات من القرن نفسه ومع بداية دخول الكمبيوتر في مجالات الحياة المختلفة بدأ التفكير في أنه من الممكن أن تقوم أجهزة الكمبيوتر بعملية الترجمة إذا توافرت لها سرعة أكبر وذاكرة أكبر.
فبدلا من المترجم البشري الذي
- يستغرق وقتا طويلا للقيام بعملية الترجمة،
- بالإضافة للتكلفة المالية التي يتم دفعها للمترجم،
- حدود القدرات البشرية على العمل لعدد معين من الساعات وكم معين من الترجمة،
- اختلاف طريقة ترجمة نفس الجمل والموضوعات من مترجم بشري لآخر،
بسبب الاحتياج المتزايد للترجمة والقدرات المذهلة للكمبيوتر مقارنة بالبشر اتجه التفكير إلى الترجمة الآلية، حيث بدأت منذ ما يزيد على 50 عاما جهود ضخمة واستثمارات طائلة تقدر بمئات الملايين وعلى أيدي الآلاف من العلماء والباحثين والمبرمجين والمطورين لإنتاج برامج وأجهزة آلية تحقق هذا الهدف: قيام الأجهزة وخاصة أجهزة الكمبيوتر بدور البشر في ترجمة النصوص من لغة إلى لغة أخرى من اللغات الطبيعية (أي اللغات البشرية تمييزا لها عن لغات الآلة التي لها برامج ترجمة أخرى).
النشأة:
جاءت نشأة فكرة الترجمة الآلية في البداية كتطوير للمعاجم الآلية التي تحتوي على معاني للكلمات المفردة، حيث كان يتم إدخال النصوص كلمة كلمة إلى برامج المعاجم أو القواميس الآلية لمعرفة معنى كل كلمة على حدة.
مثال: جملة بسيطة باللغة الإنجليزية، مثل: “He will come tomorrow.” تتكون من الكلمات he و will و come وtomorrow،
فكان يتم إدخالها كلمة كلمة لمعرفة معنى كل كلمة (ومعانيها على الترتيب هو، سوف، يأتي، غدا)، ثم يحاول الشخص أن يستخرج معنى الجملة ككل، وتتكرر نفس الطريقة مع كل كلمة وجملة في النص طال أو قصر.
ومن هنا بدأ التفكير في إمكانية الاستفادة من قدرات المعاجم الإلكترونية بشكل أفضل، وذلك من خلال إنتاج برامج جديدة يتم إدخال جمل وعبارات ونصوص كاملة إليها لتقوم ترجمتها بنفس الطريقة والسهولة والسرعة.
ولكن الأمر ليس بهذه البساطة دائما؛ فعملية الترجمة كما قلنا ليست مجرد رص معاني الكلمات بجوار بعضها بعد استخراجها من القواميس:
- فحتى هذه الخطوة الأولية البسيطة (أي استخراج معنى الكلمة) تتطلب في كثير من الأحيان أن يقوم المترجم باختيار المعنى المناسب للسياق الذي وردت فيه، إذا كان لها أكثر من معنى في القاموس،
- وبعد تحديد المعنى المناسب فهناك خطوة أهم تتمثل في حتمية فهم التركيب النحوي والصرفي للجملة الموجودة في النص الأصلي
- وبناء على هذا فهم هذه العناصر يتم تحديد كيفية استخدام وصياغة كل كلمة لتكوين الجمل في النص المترجم.
وهاتين الخطوتين السابقتين تحديدا (فهم الدلالة والتحليل اللغوي) هما ما ينقص مثل هذه البرامج التي لا تزال موجودة حتى الآن بصورة واسعة في العديد من التطبيقات والبرامج.
ونتيجة للقصور في هذين الجانبين اللذين يتميز بهما البشر نجد أنه ليس من السهل على الإطلاق الحصول من مثل هذه البرامج على ترجمة يعتد بها عند التعامل مع نصوص بها جمل مركبة تحتوي على العديد من العناصر حتى إذا كانت مباشرة (ناهيك عن احتمال كون النص نصا أدبيا يحمل العديد من الصور والتشبيهات الخيالية أو غير المباشرة).
ولذلك ظلت محصلة هذه المجهودات والاستثمارات والسنوات أقرب إلى الصفر وبعيدة تماما عن أن تكون ذات جدوى مبشرة؛ فما تزال هناك حاجة لتدخل العنصر البشري لتمحيص النص الناتج ومقارنته بالأصل، ثم محاولة الاستفادة من الترجمة وتعديلها، إلا أن هذا في حد ذاته يمثل مجهودا كبيرا قد يجد معه المترجم أنه من الأفضل أن يترجم النص بنفسه من البداية، وذلك كما يتضح لنا من الجدول التالي الذي يحتوي على مقارنة ترجمات لثلاثة برامج آلية لأكثر من جملة:
المترجم الكافي من شركة CIMOS | أداة ترجم من شركة صخر | المسبار من ATA | الجملة الإنجليزية | |
1 | متى هل سيأتي؟ | متى سجاء؟ | متى يجيء؟ | When will he come? |
2 | سيجيء ليلا في المرة القادمة. | سيجيء اللّيل القادم. | هو سيأتي التّالي ليل. | He will come next night. |
3 | لاحقا سيأتي في المساء. | المرّة القادمة سيجيء ليلاً . | في المرة القادمة هو سيجيء في ليل. | Next time he will come at night. |
4 | لا نعرف شيء في كل شيء حواليه. | نعرف لا شيء في الكلّ عنه. | نعرف لا شيء على الإطلاق عنه | We know nothing at all about him. |
5 | لا نعرف أيّ شيء عنه . | لا نعرف أيّ شيء عنه . | نحن لا نعرف أيّ شيء عنه. | We do not know any thing about him. |
قادت المرحلة السابقة الكثيرين إلى محاولة التغلب على القصور في الطريقة التي تعتمد على وضع معاني الكلمات بجوار بعضها؛ وذلك من خلال سنوات أخرى من الأبحاث والمحاولات ومئات الملايين من الاستثمارات لإضافة عنصر جديد إلى البرامج يتمثل في جعل البرامج تقوم أولا بعمليات تحليل لغوي شاملة للنص الأصلي لفهم العلاقات النحوية والصرفية والدلالية للكلمات وموقعها في الجملة، ثم بناء على هذه التحليلات يقوم البرنامج بترجمة الجمل إلى اللغة الأخرى مع محاولة تطبيق الخصائص النحوية والتركيبية للكلمات التي كانت موجودة في النص الأصلي ونقلها إلى النص المترجم.
لذلك نجد أن بعض برامج الترجمة الحالية تحتوي على محلل صرفي وعربي ودلالي ومُشكّل آلي وقواميس عامة ومتخصصة.
وقد أدت هذه المحاولات التي استغرقت في بعض الشركات ما يزيد على عشر سنوات إلى تحسن كبير في النتيجة التي يتم الحصول عليها من الترجمة الآلية لجمل ونصوص كاملة. فأصبحت الجمل الناتجة أكثر ترابطا ومنطقية إلا أنها ما تزال أيضا بعيدة للغاية عن أن تكون على المستوى الذي يمكن معه الاعتماد عليها. كما أن دقة الترجمة بها تتوقف على أمور كثيرة تتطلب عادة أن يتم إعداد النص الأصلي أولا بشكل معين لضمان الحصول على أكبر دقة ممكنة للنص المترجم:
– مثل ضرورة عدم زيادة عدد كلمات الجملة عن حد معين،
– وضرورة وجود بعض علامات الترقيم مثل النقطة للفصل بين الجمل وتحديد بداياتها ونهاياتها،
– وعند الترجمة من العربية إلى لغة أخرى يكون من العوامل المؤثرة جدا هل النص العربي مُشَكّلا أم ليس مُشَكّلا، في حين أنه في غالبية الأحيان الكتابة باللغة العربية حتى الفصحى تكون بدون تشكيل.
وفيما يلي الشروط المذكورة في أحد مواقع البريد الإلكتروني العربية التي توفر خدمة الترجمة الآلية لرسائل البريد الإلكتروني على الإنترنت، وهو موقع (arabia.com) كمثال للشكل الأمثل الذي ينبغي أن يكون عليه النص الأصلي للحصول على أفضل النتائج الممكنة عند ترجمته آليا:
- ” استخدم جمل قصيرة وبسيطة.
- تجنب استخدام اللغة العامية.
- تجنب استخدام الاختصارات أو الكلمات الغريبة إلا إذا كان متعارف عليها عالميا.
- تجنب استخدام HTML TAGS وإلا فان المترجم لن يعمل.
- إذا احتوى توقيع الرسالة على HYPER LINK أو عنوان على الإنترنت الرجاء ألا تستخدم ذلك التوقيع.
- و بعبارة أبسط, اجعل رسائلك بسيطة وخالية من التعقيد”.
وكما نرى فإن مثل هذه الحدود تجعل الأمر يفقد في كثير من الأحيان جدواه لأنه غير عملي، وبعد ذلك كله يكون مستوى الترجمة غير مضمون دائما وغير مرض غالبا.
أضف إلى ذلك أن عملية الترجمة تعتمد أصلا بدرجة كبيرة على الإدراك لتحديد المعاني والانفعالات والصور والإيحاءات التي يتوقف فهمها على تقدير السياق الذي وردت فيه، مما يجعلنا ندرك إلى أي مدى يتعذر على برامج الكمبيوتر – التي تعتمد بالدرجة الأولى على حسابات وتحليلات ومعادلات رياضية وإحصائية وقواعد لغوية أقرب للقوالب الثابتة وتختلف كثيرا عن طريقة التفكير والإدراك البشري الذي يستطيع في لحظة واحدة أن يحدد مئات العناصر، ويدمج في ثانية واحدة الملايين من العوامل والأبعاد التي توجد بصورة مباشرة في النص الأصلي، أو التي اكتسبها بصورة غير مباشرة من حصيلة خبرات على مدار حياته في جميع المجالات، ثم بناء على ذلك يقوم بتحديد كيفية ترجمة الجملة التي أمامه بما يتناسب معها ومع مدلولاتها وأبعادها المختلفة كما يحدث مثلا عند ترجمة النص الأدبي (كالشعر مثلا) حيث يحتمل معنى الجملة فيه عدة معاني قد تختلف تماما عن المعنى المباشر للكلمات التي يحتويها النص.
وفيما يلي نموذج آخر لترجمة أحد النصوص باستخدام برامج الترجمة الآلية:
1-
2- Fr–>Eng:
(Translator or translation tool unknown)
Your T-Touch is watertight to a depth of 30 meters but it is not an instrument suitable for sports diving. It is not advisable to press the pushers while the watch is submerged. None of the functions can be activated if the crystal is in contact with a liquid.
3- إنجليزي –> عربي:
(أداة الترجمة: موقع المسبار:)
تي ك لمس مانع للماء إلى عمق من 30 متر لكنّه ليس آلة مناسب لغوص الألعاب الرياضية. هو لا من المستحسن الضغط على موزّعي المخدرات بينما الساعة اليدوية مغمورة بالمياه. لا الوظائف يمكن أن تنشّط إذا البلور باتصال بسائل.*
خلاصة وتقييم:
ونخلص مما سبق إلى أن الترجمة مسألة تحتاج إلى عنصر الإدراك والفهم والتقدير بالإضافة إلى أنها تمثل تراكم خبرات يتم عبر عدة سنوات بل وأجيال متتالية وهذه كلها أمور تميز الجنس البشري وحده، في حين أن الكمبيوتر يقوم بمجرد حسابات وتطبيق معادلات بناء على قواعد ثابتة.
- فمن الناحية النظرية يستغرق المترجم البشري فترة تتراوح ما بين 20 دقيقة إلى ساعتين في المتوسط لترجمة صفحة واحدة كاملة، أما برامج الترجمة الآلية فتستغرق أقل من ثانية واحدة مما يجعلنا نتصور مدى الوقت الذي يمكن توفيره عند ترجمة كتاب يحتوي مثلا على 500 صفحة فالمترجم البشري قد يحتاج لفترة تتراوح ما بين 3 أسابيع (حوالي 250 ساعة) إلى 3 أشهر (حوالي 1000 ساعة) في حين أن الكمبيوتر قد لا يستغرق أكثر من نصف الساعة لترجمة هذا الكتاب. بالإضافة إلى أن الترجمة البشرية تكلف الكثير من الجهد والمال وتحتاج لوجود مترجم على دراية كبيرة باللغتين المصدر والهدف وكذلك بالموضوع الذي يقوم بترجمته.
ولهذا كان أحد أهم أهداف الترجمة الآلية أن يتم وضع برنامج الترجمة على أجهزة الكمبيوتر أو أية أجهزة أخرى لتقوم بالترجمة من أي لغة إلى أي لغة وفي أي موضوع وبأي كميات وفي أي ميعاد وفي وقت لا يكاد يذكر، بل والأهم أنه يمكن بسهولة تخزين هذه الترجمة واستدعاؤها في أي وقت للاستفادة منها بطرق مختلفة.
- أما من ناحية التطبيق الفعلي والواقع العملي ومن خلال الأمثلة التي ذكرناها للترجمة الآلية المتاحة حاليا وخاصة مع اللغة العربية نجد أن هذه الطريقة الآلية في الترجمة لا يمكن الاعتماد عليها بشكلها الحالي كبديل للمترجم البشري، بل غاية ما يمكن أن نتوقعه منها أن تقدم لنا مسودة أولية أو فكرة عامة عن النص الأصلي، وذلك أمر له فائدته، مثلا للحصول على فكرة سريعة عن أحد النصوص وخاصة كبيرة الحجم، أو عندما يكون المتلقي لا يجيد اللغة الأجنبية كالإنجليزية مثلا، ففي هذه الحالة يكون حصوله على ترجمة آلية تعطيه مجرد فكرة عن محتوى النص أفضل من لا شيء.
- أما مع بعض اللغات الأخرى غير العربية التي تتسم بمستويات تركيبية ودلالية أكثر بساطة كالإنجليزية والفرنسية فقد تكون النتائج أفضل كثيرا نظرا لأن مقدار الجهد العقلي والمنطقي المطلوب للتعامل معها أقل من المستوى الثري الذي تتمتع به اللغة العربية. ولذلك فالاعتماد على هذه النظم مع اللغات الأخرى أكثر جدوى من اللغة العربية، ورغم ذلك فإن الأنظمة الآلية الموجودة حاليا للتعامل مع هذه اللغات ما تزال أيضا بعيدة عن أن تحل محل البشر بصورة كاملة، وما يزال الاعتماد عليها يقتصر على مجالات محدودة كالترجمات الاقتصادية للاتحاد الأوربي، أو النشرات الجوية. أما حينما حاول المسئولون في إحدى الولايات الألمانية استخدام أحد برامج الترجمة الآلية لترجمة كتاب سياحي عن الولاية من الألمانية إلى الإنجليزية فقد جاء ترجمة الكتاب مليئة بأخطاء فادحة في الترجمة اضطرت المسئولين لسحب الكتاب من أماكن توزيعه، وتقديم اعتذار شديد عن هذا الخطأ الكبير الذي ارتكبوه.
و من أهم التطبيقات التي نجد لها بعض الفائدة للترجمة الآلية حاليا الإمكانية المتاحة والمتمثلة في ترجمة مواقع الإنترنت بحيث لا يحتاج القارئ إلى أكثر من كتابة عنوان الموقع الذي يريد ترجمته فيظهر له الموقع نفسه وفي ثواني، ولكن مترجما باللغة العربية وذلك بدقة تراوح ما بين 60-90 % حسب الموقع المستخدم للترجمة وحسب طبيعة النص والمجال الذي يتناوله.
وفيما يلي نموذج لصفحة إنترنت (موقع Yahoo) مترجمة مرتين الأولى باستخدام موقع “عجيب” الخاص بشركة “صخر” والثانية من ترجمة موقع “المسبار” التابع لشركة “ATA” ومقرها في لندن (وهو يجمع بين كل من “المترجم العربي” و”الوافي للتّرجمة العربية“).
(ويجب علينا ونحن نُقيم هذه الترجمات أن نتذكر دائما أنها ترجمة مجانية تتم في ثوان معدودة وأنها تتيح للكثيرين متابعة محتويات الكثير من المواقع المفيدة في الإنترنت حتى إذا كانت معرفتهم باللغات الأجنبية محدودة أو معدومة من الأصل):
* ونلاحظ هنا واحدا من أكثر ما يميز الترجمات الآلية لمواقع الإنترنت، وهو أنها لا تكتفي بمجرد ترجمة كل نص في موضعه فقط؛ بل إنها تقوم أيضا بتغيير شكل الصفحة ومواضع النص من الجهة اليسرى إلى الجهة اليمنى ليتناسب مع اتجاه الكتابة والقراءة في اللغة العربية.
* ومن أهم الملاحظات المتعلقة بالترجمات الآلية بصفة عامة ولمواقع الإنترنت خاصة أن الجهات المقدمة للترجمة الآلية تحرص دائما على تأكيد عدم مسئوليتها عن جودة الترجمة وعلي أنها لا تمثل أكثر من مساعدة.
وهذا هو المنظور الذي يجب أن ينظر منه في الوقت الحالي للأنظمة والبرامج المتوافرة للترجمة الآلية، حتى تصل في المستقبل إلى مراحل أكثر تطورا تجعل من الممكن الاعتماد عليها في مجالات أكثر بمزيد من الثقة في كفاءة أدائها؛ فالترجمات الآلية وإن كانت تفوق البشر بصورة مذهلة من حيث السرعة، إلا أنها ما تزال بعيدة كل البعد عن أن تقارب الأداء البشري من حيث الكفاءة والدقة وإمكانية الاعتماد بثقة على نتائجها المباشرة.
ذاكرة الترجمة TM
(الترجمة بمساعدة الآلة MAT أو بمساعدة الكمبيوترCAT)
بعد سنوات طويلة من التجارب والمجهودات وبعد الاستثمارات الطائلة في مجال الترجمة الآلية الكاملة في محاولة للوصول إلى بديل إلكتروني للمترجمين البشريين تأكد للقائمين على هذا المجال أنه ما يزال أمام أنظمة الترجمة الآلية زمن طويل حتى يمكن الاعتماد عليها، وحتى يكون استخدامها ذا جدوى حقيقية.
ولذلك اتجه تفكير الكثيرين منذ مدة طويلة تصل إلى حوالي 20 سنة أو أكثر إلى ضرورة وجود حل وسط عملي يدمج بين إمكانيات الطرفين – أي البشر والأجهزة – ويجمع جوانب تفوق كل منهما انتظارا لوصول أنظمة الترجمة الآلية للمستوى العملي المأمول:
أ – فالأنظمة الإلكترونية تتميز:
- بالسرعة المذهلة،
- والدقة البالغة،
- والتوحيد التام (أي ترجمة المصطلح الواحد بنفس الطريقة دائما)،
- وإمكانية الاحتفاظ بكميات كبيرة جدا من المعلومات في مساحات تخزين تكاد لا تذكر،
- وإمكانية الاستفادة مما سبق ترجمته مرات أخرى فيما بعد،
ب – بينما يتميز البشر:
- بالقدرة على فهم والتمييز المنطقي،
- والقدرة على إبداع الجديد والاستفادة من تراكم الخبرات،
- والقدرة على اختيار الصياغات المناسبة أو تعديلها لتلائم السياق.
ويتمثل هذا الحل الوسط الذي يجمع بين إمكانيات وتميز كل من البشر والأنظمة الآلية في البرامج المعروفة باسم ذاكرة الترجمة
(Translation Memory – TM) التي إما تصنف على أنها برامج ترجمة بمساعدة الآلة (Machine Aided Translation، ويرمز لها اختصارا بالرمز MAT) أو برامج ترجمة بمساعدة الكمبيوتر (Computer Aided Translation، ويرمز لها اختصارا بالرمز CAT).
تعريف:
يقصد بتقنية ذاكرة الترجمةالبرامج الإلكترونية التي يستعين بها الإنسان بالاستعانة بها ليترجم بنفسه النص فيها، ثم يحتفظ به مخزنا داخلها؛ ليستفيد من هذه الترجمة بعد ذلك عندما يأتيه نص آخر مماثل، أو به حتى مجرد أجزاء مشابهة للترجمة السابقة. مما يؤدي إلى توفير الكثير من الوقت والجهد، وأيضا ضمان التوحيد وترجمة المصطلح الواحد دائما بنفس الطريقة، وخصوصا عندما يكون عمل المترجم يتكرر فيه ترجمة نوعية معينة من النصوص في مجال محدد.
فهذا يعني توفيرا كبيرا في الوقت والجهد؛ فالنص الذي يتم ترجمته مرة ليس هناك حاجة لأن يقوم المترجم بترجمته مرة أخرى من جديد، بالإضافة إلى إمكانية استفادة أشخاص آخرين من ترجمة المترجم الأول. وهذا أمر له أهمية كبيرة خاصة لدى المترجمين في المجالات التي يكثر فيها التكرار مثل المجالات التقنية والعلمية.
وبالإضافة إلى ذلك فهناك ميزة أخرى هائلة في برامج ذاكرة الترجمة تتمثل في قدرتها على التنسيق النص المترجم بنفس الشكل الذي كان به النص الأصلي، وهذا الأمر وحده يعد من أهم مميزات برامج ذاكرة الترجمة إذ أنه يعني أن المترجم لم يعد بحاجة لأن يقوم بنفسه بتنسيق صفحات النص المترجم، ولا للاستعانة بشخص آخر لينسق له النص بعد ترجمته.
وهناك عدة برامج عربية وعالمية في مجال ذاكرة الترجمة مثل: Transit من شركة Star-Group وTrados وCAT من شركة صخر العربية وغيرها من البرامج من العديد من الشركات في أنحاء العالم.
وفيما يلي نتناول بمزيد من التفصيل كيفية العمل باستخدام برامج ذاكرة الترجمة، وفوائد استخدامها وخاصة في المجالات التي تتكرر أو تتشابه فيها النصوص التي يتم ترجمتها.
فيما مضى عندما كان المترجم يريد أن يترجم أي نص يحتوي على نسبة تشابه مع نص قديم تمت ترجمته من قبل، مثل دليل تشغيل موديل جديد أو معدل لإحدى السيارات، فإنه كان يقوم – في أحسن الأحوال – أولا بالبحث في أدلة التشغيل التي قام بترجمتها من قبل لمحاولة العثور على دليل تشغيل مشابه لدليل التشغيل الجديد ليتمكن بأقل مجهود من تعديل الدليل القديم ليصبح مماثلا للدليل الجديد بالضبط. وكان هذا يعني الحاجة لقضاء وقت طويل أولا في البحث عن دليل قديم مناسب ثم يقوم بعد ذلك بمقارنة الدليل القديم مع الدليل الجديد فقرة بفقرة وجملة بجملة وكلمة بكلمة لتحديد مواضع الاختلاف وتعديلها، وهذا بالطبع يستغرق وقتا طويلا قد يستمر لعدة أسابيع. وبعد ذلك تأتي خطوة أخرى تتمثل في تنفيذ التعديلات الجديدة في الترجمة على نسخة من ملف الدليل القديم على جهاز الكمبيوتر، وهذا مجهود إضافي كبير إما أن يقوم به المترجم نفسه أو يقوم به شخص آخر متخصص في الكمبيوتر وهذا يعني بالطبع الحاجة للمزيد من الوقت لتنفيذ الشكل النهائي للنص المترجم.
ليس هذا فحسب بل إنه بعد ذلك عندما يكون هناك دليل ثالث يختلف أو يتشابه مع الدليلين السابقين، فعلى المترجم أن يقوم بالخطوات نفسها من جديد، أي البحث عن التشابهات، ثم الترجمة، ثم تنفيذ التعديلات على الكمبيوتر، وهكذا مع كل دليل جديد، فلنا أن نتصور حجم هذا المجهود إذا كان كل دليل تشغيل في حدود 400 صفحة، وخاصة إذا وضعنا في اعتبارنا أن المجهود الذي يتطلبه تنفيذ مثل هذا الدليل على الكمبيوتر هو مجهود ضخم وخاصة إذا كانت الترجمة من الإنجليزية مثلا إلى اللغة العربية، فهذا يعني على أقل تقدير إنه يجب أن يتم تغيير مواضع جميع النصوص والصور والأعمدة الموجودة في النص الإنجليزي إلى الاتجاه العكسي من الصفحة لأن اللغة العربية يتم قرأتها من اليمين إلى اليسار بعكس الإنجليزية مثلا.
كيف تعمل برامج ذاكرة الترجمة؟
أما الآن فإننا نجد أن برامج ذاكرة الترجمة قد اكتسبت أرضية واسعة وازداد انتشارها بسرعة في السنوات الأخيرة نظرا لمميزاتها الهائلة وقدراتها العالية في الناحيتين: توفير وقت ومجهود الترجمة، وتقليل الوقت اللازم لتنفيذ الترجمة على الكمبيوتر إلى درجة أنه في بعض الأحيان لا تكون هناك حاجة تقريبا للقيام بأي مجهود في النص المترجم من حيث الشكل والتنسيق وخاصة إذا كانت الترجمة ما بين اللغتين لهما نفس الاتجاه الكتابة مثل اللغة الإنجليزية والألمانية مثلا.
وتقوم فكرة برامج ذاكرة الترجمة وعلي أن المترجم يحدد للبرنامج:
- الملف الذي يريد أن يقوم بترجمته
- الملفات القديمة التي يمكن أن يستعين بها البرنامج كمرجع يقارن الترجمة الموجودة فيها بالملف الجديد.
فيقوم البرنامج:
- بتحليل الملف،
- وفصل عناصر التنسيق والشكل مثل أحجام الخطوط وألوانها والصور وأماكنها،
- ومقارنة النص في الملف الجديد بالملفات القديمة المحددة كمرجع ليستخلص منها المواضع المتماثلة،
- ويقدم البرنامج للمترجم نافذتين تحتوي إحداهما على النص الإنجليزي مثلا، ونافذة أخرى تجاورها أو أسفلها لا تحتوي إلا على النص وحده مجردا من كل عناصر الشكل ليقوم المترجم بكتابة النص العربي مثلا في النافذة الثانية دون أن ينشغل بشكل الصفحة والعناصر الموجودة فيها مثل الرموز والصور، بل يصب كل تركيزه فقط على ترجمة النص،
وذلك بعد أن يكون البرنامج قد قام في البداية بأخذ مواضع النص المتماثلة في الملف الجديد مع الملفات القديمة ووضع الترجمة الخاصة بهذه المواضع التي كانت موجودة في الملفات القديمة في الملف الجديد؛ وبذلك لا يحتاج المترجم إلى مقارنة الملف الجديد بالملفات القديمة بنفسه ولا إلى ترجمة أي نصوص سبق أن تمت ترجمتها قبل ذلك مرة أخرى.
وهذا يجعلنا نتصور مدى التوفير في الوقت والمجهود الذي تحققه برامج ذاكرة الترجمة للمترجم في الخطوة السابقة التي تعتبر مجرد خطوة أولى تليها مساعدات أخرى يقدمها البرنامج للمترجم أثناء عمله، وأهم ما في هذه الطريقة أنه يتم الحفاظ على الجودة البشرية للترجمة، وفي نفس الوقت يتم الاعتماد على السرعة الفائقة لأجهزة الكمبيوتر لإنجاز الترجمة في أقل وقت ممكن.
والشكل التالي يوضح نموذجا لأحد الملفات أثناء ترجمته في أحد برامج ذاكرة الترجمة:
فكما نرى يظهر النص مقسما إلى جمل متتالية (أو فقرات حسب اختيار المترجم في بعض البرامج)، وبعد انتهاء المترجم من ترجمة كل جملة من هذه الجمل (أو كل فقرة من الفقرات) يجعل البرنامج يقوم بتخزين ترجمته لهذه الجملة (الفقرة).
ثم ينتقل البرنامج بعد ذلك إلى الجملة التالية، ويقوم بالبحث في الترجمات المخزنة في ذاكرته سواء في الملفات القديمة أو في الملف الذي يتم ترجمته حاليا عن الجمل المشابهة، فإذا وجد أن هناك جملة تتطابق تماما مع الجملة الجديدة ( مثلا عند ترجمة جملة في بداية فقرة تتماثل مع العنوان الخاص بها)، فيقوم البرنامج أتوماتيكيا بوضع ترجمة الجملة السابقة مكان الجملة الجديدة (بشرط التطابق بينهما بنسبة 100%).
أما إذا كانت الجملة الجديدة تتشابه مع الجملة القديمة فقط بنسبة معينة يحددها المترجم بنفسه (كأن يحدد المترجم للبرنامج ألا تقل نسبة التشابه بين الجملة المراد ترجمتها والجملة السابقة مثلا عن 80 %، فمثلا يكون الفارق بينهما كلمتين فقط) فتظهر في هذه الحالة في نافذة ثالثة مستقلة تحتوي على الجملة السابقة بالإضافة إلى الجملة الجديدة مع ترجمة الجملة السابقة وتحدد للمترجم مواضع الاختلاف بين الجملتين، وتتيح للمترجم إمكانية قبول وضع الترجمة القديمة مكان الجملة الجديدة ثم يقوم هو بعد ذلك بمجرد تعديل مواضع الاختلاف بين الجملتين القديمة والجديدة، وذلك بدلا من أن يقوم بترجمة الجملة الجديدة بالكامل بنفسه.
فمثلا إذا كان المترجم قد قام بترجمة وتخزين جملة تقول: ” أغلق الباب الأمامي جيدا”، ثم جاءت جملة جديدة تقول “أغلق الباب الخلفي جيدا”، فإن البرنامج يعرض للمترجم الجملتين الإنجليزية القديمة والجديدة والترجمة العربية القديمة كاقتراح لترجمة الجملة الجديدة ويوضح له أن الاختلاف بينهما فقط في الكلمتين “الأمامي” و”الخلفي”، فيستطيع المترجم أن يقبل ترجمة الجملة الأولى ثم يعدل كلمة “الأمامي” إلى “الخلفي” فقط ليس إلا.
بل إن هناك بعض البرامج مثل برنامج Transit تتميز بقدر أكبر من الذكاء الاصطناعي يتيح لها أن تقوم بنفسها ببعض التغييرات أوتوماتيكيا لتجعل الجملة القديمة مطابقة للجملة الجديدة في حالة وجود مجرد اختلافات بسيطة بينهما كاختلاف رقم مثلا، ففي هذه الحالة يقوم البرنامج بتغيير هذا الرقم بنفسه لتصبح الجملتان متماثلتين تماما بدون أي مجهود من المترجم سوى الموافقة على ترجمة الجملة والانتقال للجملة التالية.
فمثلا إذا كانت هناك جملة في الملف القديم تقول: “حقوق الطبع لعام 2002 محفوظة”، ثم جاء في الملف الجديد جملة تقول: “حقوق الطبع لعام 2003 محفوظة”، فإن البرنامج يقوم أوتوماتيكيا بتغيير 2002 إلى 2003، فيوافق المترجم على هذه الترجمة دون أن يكتب منها حرفا واحدا.
* وهذه المساعدات الفعالة لا تقتصر فقط على مجرد الجمل بل إنه يشمل فقرات وصفحات وفصول كاملة في بعض الأحيان نظرا لدرجة التشابه الكبير في مثل هذه الأدلة والمجالات التي يتكرر فيها استعمال نفس المصطلحات والنصوص، مما يوضح لنا مدى الفائدة العملية الفعلية التي تتحقق في هذه الحالة عند استخدام برامج ذاكرة الترجمة بعكس الوضع عند استخدام برامج الترجمة الآلية، فالميزة الكبيرة لبرامج ذاكرة الترجمة هو أنها لا تقوم بالترجمة بنفسه بل إنها مجرد ذاكرة لحفظ واسترجاع الترجمات التي يقوم بها البشر، بالإضافة إلى أنها تعتمد على المترجم البشري في إدخال النص وتحديد مدى درجة التشابه وصلاحية الجملة المخزنة في البرنامج للاستخدام في الموضع الجديد، فدور مثل هذه البرامج – التي تعتبر فعلا مساعدة قيمة للإنسان – أنها توفر له الكثير من الوقت والجهد وتجعله يركز فقط على الأجزاء الجديدة التي لم يتم ترجمتها من قبل، أو بل وتساعده على تحسين الترجمات الموجودة من قبل.
ويضاف إلى هذه المميزات الرائعة لبرامج الذاكرة الترجمة أن هذه البرامج تكون في العادة مصحوبة ببرامج أخرى عبارة عن قواميس وقواعد بيانات إلكترونية تتيح للمستخدم أن يقوم بتخزين المصطلحات التي يستخدمها باستمرار في هذا البرنامج مثل برنامج Termstar مع Transit أو برنامج MultiTerm مع Trados مما يجعل المترجم قادرا على الاستفادة من المصطلحات التي تمت ترجمتها من قبل في ترجمات أخرى، حيث يقوم البرنامج بتوضيح الكلمات المخزنة كمصطلحات في القاموس، ويمكن للمترجم أن يجعل القاموس يضع الترجمة الكلمة المخزنة فيه مكان الكلمة الموجودة في النص الأصلي، بل إن بإمكانه أن يجعل القاموس يقوم بوضع جميع المصطلحات المترجمة المخزنة فيه مكان جميع المصطلحات الموجودة في النص الأصلي، فمثلا يستبدل كلمة “car” الإنجليزية بترجمتها العربية وهي “سيارة”. وهذا لا يقتصر فقط على الكلمات بل أيضا على التراكيب والتعبيرات المكونة من أكثر من كلمة، وبذلك يجد المترجم في لحظات أن النص الأصلي قد أصبح يحتوي على أجزاء متعددة مترجمة بالفعل تمثل الكلمات أو المصطلحات والتعبيرات التي لها ترجمة في القاموس. وهذا كله يساعد بالطبع على زيادة سرعة ودقة الترجمة ودرجة التوحيد في ترجمة المصطلح الواحد، وهذا يعد أمرا غاية في الأهمية في الترجمات التقنية، فليس من المقبول مثلا أن يتم ترجمة المصطلح الإنجليزي “steering wheel” على سبيل المثال في أحد مواضع الكتاب بالكلمة العربية “المقود” ثم يتم ترجمة نفس الكلمة الإنجليزية في موضع آخر بكلمة “عجلة القيادة”، بل لا بد أن تستخدم إحدى الترجمتين فقط على مدار النص الذي يتم ترجمته بالكامل. فمثل هذه الإمكانية تجعل المترجم واثقا أنه قد قام بترجمة المصطلح
“steering wheel” في جميع مواضع النص بطريقة واحدة هي الموجودة في قاموس البرنامج، كما يمكن للمترجم أو للمراجع أن يكلف البرنامج بمقارنة آلية للمصطلحات التي تم استخدامها في ترجمة النص للتأكد من تطابق هذه المصطلحات مع المصطلحات المسجلة في القاموس.
وبعد أن ينتهي المترجم من العمل في الترجمة داخل البرنامج يقوم بحفظ الترجمة بكاملها، ثم يجعل البرنامج يقوم بتنفيذ واحدة من أروع المزايا الموجودة فيه وهي وضع النصوص التي قام بترجمته في ملف جديد (باللغة العربية إذا كانت الترجمة إلى اللغة العربية مثلا) يماثل تماما الملف الذي يحتوي على النص الإنجليزي من حيث الشكل والتنسيق ومواضع نصوص والصور والرموز وأشكال وألوان وأحجام الخطوط إلى آخر عناصر التنسيق الأخرى ولكن بحيث تكون من اليمين إلى اليسار بعكس اتجاه أماكنها في النص الإنجليزي.
وهذه ميـزة يعرف قيمتـها بحق من تعامل مع هذه النوعية من الترجمات التي يكون مطلوبا فيها أن يكون النص المترجم مطابقا بنسبة 100 % للنص الأصلي من حيث الشكل كما لو كان قد تم عكسه باستخدام مرآة، وتنفيذ هذه الخطوة بهذه السهولة كان يعد قبل عدة سنوات مجرد حلم، وتحتاج لشخص متخصص في الكمبيوتر ليقوم بجهد كبير لتنفيذ نفس تنسيق النص الأصلي على النص المترجم.
وهناك إمكانية أخرى لا تقل في أهميتها عن كل الإمكانيات السابقة إن لم تكن تفوقها تمثلت في قدرة بعض البرامج على تحليل النص الأصلي وتحديد الجمل والمواضع التي تتكرر بنفس النص أكثر من مرة موزعة في مواضع مختلفة من النص، فمثلا إذا كانت هناك تحذير معين يتكرر على مدار دليل التشغيل خمس مرات، فإن البرنامج له القدرة على عدم إظهار النص المكرر للمترجم إلا مرة واحدة فقط إذا اختار هذه الإمكانية، وبعد أن يقوم المترجم بترجمة هذا النص في مرة واحدة، يقوم البرنامج في النهاية بتوزيع هذا النص المترجم على المواضع الخمسة التي جاء فيها رغم أن المترجم لم يره أو يقم بترجمته إلا مرة واحدة.
وعندما نجمع كل هذه المزايا إلى جانب بعضها نستطيع أن نتخيل إلى أي مدى يمكن لهذه البرامج أن توفر للإنسان وقته وجهده وأيضا تقليل التكلفة المالية التي تتطلبها عملية الترجمة، بالإضافة إلى كونها عنصرا فعالا للغاية لضمان دقة وجوده الترجمة، فبعد أن كانت ترجمة دليل تشغيل سيارة مكون من 500 صفحة يحتاج إلى عمل مترجمين أو ثلاثة لمدة قد تصل إلى أسبوعين للترجمة والمراجعة بالإضافة إلى ضرورة قيام الشخص متخصص في الكمبيوتر باستخدام برامج معينة لإنشاء ملف جديد يحتوي على النص المترجم وبنفس تنسيق النص الأصلي، أصبح هذا الأمر الآن من الممكن أن يقوم به شخصين فقط لا غير باستخدام برامج الذاكرة الترجمة، بل وأيضا في مدة لا تزيد عن 3 الأيام فقط اعتمادا على الترجمات السابقة المماثلة والمشابهة والقواميس وقواعد البيانات المدمجة معها، وذلك – وهو الأهم – مع زيادة في مستوى جودة الترجمة البشرية ودقة الترجمة والتوحيد في المصطلحات.
– جزء عن الإمكانيات والمساعدات الممتازة المتمثلة في التقارير وإدارة الملفات |
المعاجم والقواميس الإلكترونية
تعريف:
هي برامج إلكترونية تقدم للمستخدم معاني كلمات لغة ما بلغة أخرى أو أكثر، أو تقدم له شرحا لمعنى مصطلح ما في أحد المجالات العلمية أو العامة. وهي تتميز بسعاتها الكبيرة من الكلمات والتراكيب سواء ثنائية أو أحادية اللغة، بالإضافة إلى السهولة والسرعة الكبيرة في البحث عن المعاني والمصطلحات المختلفة.
وتعتبر هذه التقنية من أقدم التقنيات الإلكترونية الموجودة في المجال اللغوي وأيضا من أكثرها انتشارا بين المستخدمين، كما أن هناك أعدادا هائلة من والجهات الشركات التي نجدها مثلا في قواميس الجيب والقواميس الناطقة المنتشرة في أيدي الطلبة والدارسين والمسافرين وغيرهم.
وهذه النوعية من البرامج الإلكترونية تتميز بانتشارها الواسع الذي يشمل العديد من المجالات اللغوية والعلمية نظرا لما يتوافر بها من مميزات كالسرعة والسهولة، وتتوافر في صورة أجهزة متنقلة في حجم الجيب أو على أجهزة الكمبيوتر أو توجد كتطبيقات مستقلة على أجهزة الحاسبات الكفية، وعلى مواقع الإنترنت، بل إن هناك نسخ حديثة منها موجودة في أجهزة هيئة قلم يقوم المستخدم بتمريره على النص فيتعرف على الكلمات باستخدام برنامج تعرف على الحروفOCR وينقلها للقاموس (أو حتى لبرنامج ترجمة نصوص) فتظهر معاني الكلمات (أو النص) على الشاشة في نفس اللحظة، فهناك:
- قواميس لغوية عامة لترجمة المعاني من لغة لأخرى،
- قواميس لغوية متخصصة لترجمة المعاني من لغة لأخرى في مجال معين كالقانون كالطب أو الهندسة أو الكمبيوتر…. الخ،
مثل مجموعة قواميس Brandstetter الفنية والصناعية والتجارية (ألماني – إنجليزي)، ومجموعة القواميس الممتازة من إنتاج الشركة المتحدة لنظم وبرامج الكمبيوتر ومنها القاموس الطبي والقاموس الهندسي ومعجم المصطلحات القانوني التجاري ومعجم الكمبيوتر … الخ.
- معاجم بلغة معينة لشرح مصطلحات مجال معين بنفس اللغة مما يجعلها أقرب للموسوعات المتخصصة، وتكون عادة مصحوبة بالصور والرسوم التوضيحية كمجموعة قواميس Duden الألمانية التي تزيد عن 20 قاموس ومعجم باللغة الألمانية في مختلف المجالات اللغوية والتخصصية وتوجد جميع على أسطوانة ليزر واحدة يمكن البحث في جميع محتوياتها خلال ثانية واحدة، في حين أن النسخة الورقية من هذه القواميس يتجاوز حجمها 20 ألف صفحة مما يجعلنا نتخيل الفارق الضخم في المجهود والوقت والسهولة الكبيرة عند البحث على النسخة الإلكترونية مقارنة بالبحث اليدوي في النسخ المطبوعة.
بالإضافة لوجود ميزة رائعة في الكثير من الأجهزة والبرامج الحالية الخاصة بالمعاجم والقواميس وهي إمكانية قيام البرنامج بنطق الكلمات مما يمثل معاونة كبيرة للمستخدم في كثير من الأحيان خاصة لمن ليس على درجة كبيرة من التمكن في لغة معينة أو مجال ما.
(وأنتهز هذه الفرصة للدعوة أولا لترجمة هذه القواميس الممتازة إلى العربية؛ لأنها المرجع الرئيسي للمتعاملين مع اللغة الألمانية، وترجمتها إلى العربية سيعود بنفع كبير على كل العرب وخاصة المتعاملين مع اللغة والمؤسسات الألمانية، وسيؤدي هذا العمل لنقلة نوعية ضخمة في قدرة العرب على التعامل مع الألمان في مختلف المجالات.
وأدعو ثانيا لدراسة هذه السلسلة القيمة من القواميس والإصدارات والعمل على إصدار مجموعة مماثلة للغة العربية من حيث الأسلوب والموضوعات، لأن معاجمنا وقواميسنا العربية بصراحة ينقصها الكثير لتقوم بالدور المنوط بها في دعم اللغة وتقريبها لأهلها ولمتعلميها من غير الناطقين بها.
وثالثا أنادي بضرورة العمل على نشر إصدارات وأعمال مجمع اللغة العربية على أسطوانات الليزر وبأسعار في متناول غالبية الناس؛ لجعل أعمال المجمع – التي ينبغي أن تأخذ مكانتها التي تستحقها – هي المرجع الذي يعتد به في شئون اللغة العربية.)
المعالجة الآلية للبيانات
تعريف:
يقصد بها أنظمة تتكامل فيها مجموعة من التقنيات المتنوعة للتعامل مع البيانات بمختلف أشكالها لتوفر للمستخدم قدرة عالية على التعامل بكفاءة مع مختلف البيانات وتنظيمها بشكل يسهل استعادة هذه البيانات في أي وقت واستعمالها بأي شكل من الأشكال.
وتعد من هذه التقنية من أروع التطبيقات المتعلقة بالمعالجة الطبيعية للغة حيث يمكن لهذه الأنظمة عند استعمالها في شركة كبيرة مثلا أن تقوم بتخزين جميع المعلومات من جميع المصادر (أوراق، ميكروفيلم، فاكسات، بريد إلكتروني، ملفات النصوص، مستندات HTML،
ملفات كمبيوتر والمستندات الورقية…إلخ). ويلي ذلك تصنيف هذه المعلومات وفقاً لخصائص تحددها قاعدة البيانات. وأخيراً، جعلها كل هذه البيانات متاحة وقابلة للبحث فيها.
وهناك برامج يمكنها القيام بعمل أرشفة لهذه البيانات المتنوعة وتقوم بتصنيفها وحفظها ليسهل بعد ذلك البحث في الكم الهائل من المعلومات والبيانات والمراسلات التي أصبحت من سمات الحياة اليومية في المؤسسات والشركات وأماكن العمل المختلفة.
كما بإمكان بعض البرامج التي يمكنها القيام بتحليل المستندات المختلفة وعمل ملخص آلي لها، أو عمل فهرس آلي بمحتويات المستندات المختلفة، بل يمكن حتى القيام بمقارنة محتويات بعض المستندات المتشابهة لمعرفة الاختلافات بينها. (ومن أبسط البرامج التي يمكنها عمل تلخيص آلي للمحتويات ومقارنة المستندات ببعضها البعض برنامج Word من Microsoft وإن كان لا يحتوي على المميزات الأخرى التي تكون نتيجة لتكامل عدة تطبيقات معا).
بالإضافة للإمكانيات التي تقدمها البرامج التي تعمل كقواعد بيانات مستقلة أو ضمن برامج أخرى مثل برنامجي Access من Microsoft وOracle 9i من شركة Oracle التي تعد من أكبر الشركات المتخصصة في مجال قواعد البيانات. حيث يمكن باستخدام مثل هذه البرامج تخزين جميع البيانات وتصنيفها بالشكل الذي يتلاءم مع احتياجات كل مستخدم سواء فرد أو شركة والبحث فيها عن بيانات معينة كمعلومات عن أحد الموظفين وتاريخه الوظيفي وراتبه، أو مستوى مبيعات أحد الفروع، أو مدى كفاية مستلزمات التشغيل وقطع الغيار الموجودة في المخازن…. الخ، ويمكن إنشاء تقارير متعددة الأشكال في ثوان معدودة مزودة بالرسوم البيانية لمعرفة كل دقائق العمل وتطوراته المختلفة واوجه التميز والنقص فيها.
وهذه كلها الأمور كانت تحتاج في السابق لأعداد كبيرة من الموظفين لحفظها وأرشفتها والبحث فيها، أما الآن فكل ما يحتاجه الأمر عدد محدود من الموظفين الذين يتولون تغذية مثل هذه الأنظمة بالمعلومات والبيانات وإداراتها والبحث فيها. فإذا تخيلنا مثلا شركة بها حوالي 500 موظف تتعامل يوميا في كم كبير من البيانات، فكيف لها أن تضمن توافر جميع المعلومات بشكل فوري لدى جميع الأفراد الذين تخصهم هذه المعلومات، وكيف يكون لدى جميع المديرين جمع المعلومات التي وصلت إلى كل موظف تحتهم في نفس اللحظة وبصورة منظمة يسهل التعامل معها والرجوع إليها في أي وقت بسهولة وسرعة؟ لا شك أن شركة كهذه إذا لم تستخدم نظاما قويا لمعالجة البيانات وتصنيفها وأرشفتها واسترجاعها، فمن المؤكد أنها ستخسر الكثير جدا من الوقت والجهد، فضلا عن احتمالات ضياع بعض المستندات أو عدم وصول المعلومات في الوقت المناسب للمسئولين عنها، مما يمثل إهدارا كبيرا للموارد والطاقات.