ذاكرة الترجمة

ShiMauRo

محرر <a href="/forums/22">مجلة ألفا</a>
إنضم
16 مارس 2012
المشاركات
581
الإعجابات
819
#1
السلام عليكم ورحمة الله تعالى وبركاته

ذاكرة الترجمة ما لها وما عليها؟

يطلق مصطلح ذاكرة الترجمة على ما ترجمه شخص من كلمات و جمل، فيتم تخزينها في قاعدة بصيغة تي إم TM التي تعني ذاكرة الترجمة باللغة الإنجليزية "Translation memory" و هناك صيغ أخرى. و يتم إنشاء هذه الصيغ بإعتماد برامج مثل أوميجاتي OmegaT المفتوح المصدر أو برامج أخرى مغلق المصدر مثل البرنامج SDL Trados، وهذه البرامج برمثها يطلق عليها مصطلح CAT أي Computer Assisted Translation اي الترجمة بإستخدام الحاسوب -للإشارة فقط نحن لا نتحدث عن الترجمة الألية- و لتفادي ه>ا الخلط فإنهم يفسرون CAT هكدا: Computer Cannot Translate أي أن لاحاسوب لا يمكنه القيام بالترجمة.

تصور انه لديك مخزون به جل الكتب الإنجليزية المترجمة، كلمة كلمة وجملة جملة وفقرة فقرة، إن لن تحتاج بعد ذلك لترجمة النص بالكامل فقد يغنيك تكرار الجمل و الفقرات على ترجمة 40% منه، أي انك ربحت هذه النسبة وصار بإمكانك ان تنتج اكثر، الأمر أشبه بان يتحد عشرات العقول لترجمة نص واحد، ثم أنه يغنيك عن البحث عن مدلول مصطلح جديد، لأنه غالبا ما كان العرب يعطيك عشرة مصطلحات للشيء ذاته -ه>ا كان قديما- أما الآن فنعجز عن العثور المصطلح، وقصة المصطلح قصة مؤلمة بالنسبة للعرب. فرغم الانترنيت يأبهون ان يؤسس قاموسا عربيا إلكترونيا موحد تكون له القدرة على توحيد الجهود لإنتاج مصطلحات حديثة، فلطالما واجهت أصدقائي بسؤالهم كيف تترجم "Selfie"، إنه مقبول أن تعربها وتقول "سلفي" و لكن أن تترجمها إلى "صورة ذاتية" فتجعل من كلنة كلماتان ومعنى مبهم.

إدا قلنا بأن ذاكرة الترجمة هي مجهود الشخص من الترجمة المخزن بالحاسوب و الذي بإمكانه مشاركته مع الآخرين. و في حالة تعذر العثور على ذاكرة ترجمة جاهزة تغنيك عن البدء من الصفر، فبأكيد ستبدا من الصفر مثلي. و لتخطي هذه الإنطلاقة المتعبة و المجهدة، نجد أن هناك العديد من النصوص المترجمة على النت و الذي يتبقى هو تحويلها إلى ذواكر ترجمة أو ذاكرة ترجمة شاملة، وفي كلا الحالتين يكون البرنامج قادرة على إسترجاعها أثناء ترجمتك.

الخطوة التي تسبق إنشاء ذاكرة الترجمة متعبة هي ايضا، إذ يجب عليك أن تحول النص الأصلي و المترجم إلى وحدات، يعني أن كل جملة أو فقرة من النص الأصلي يجب أن يكون بجانبها الترجمة المناسبة لها. و قد تحتوي ذاكرة الترجمة على مئات الوحدات. إذن المتعب في الامر هو النسخ و اللصق لهذه الجمل و الفقرات الاصلية و المترجمة. مثلا في برنامج الإكسيل، تفتح صفحة و في العمود "أ" تنسخ فقرات النص الانجليزي تحتفذ بالملف و تسميه "X" ثم تغلق البرنامج، تقتح صفحة جديدة في برنامج الإكسيل بملف جديد تحت إسم مغاير "Y" و تنسخ فقرات النص المترجم مع إحترام رقم الخانة. مثلا في صفحة المجدول "X" و في الخانة "A1" العبارة التالية : " َAlpha-Sci.org is amazing" . وعليه فإنه يجب أن يكون في صفحة المجدول "Y" و في الخانة "A1" ترجمة المناسبة: " يعتبر Alpha-sci.org موقعا رائعا " أو " يعد موقع مكتبة ألفا العلمية على النت موقعا رائعا" وهكذا دواليك.
يمكن تحول يمكن تحويل الصيغ المكتبية إلى ذواكر ترجمة، مثل docx - xslx - php - Html - txt -.............إلى آخره.

الحمد لله أننا لا نجد مشكلة مع دعم اللغة العربية في هذه البرامج، لكن هنا نقف أمام مشكلتين جديدتين:
  1. النسخ و اللصق متعب جدا، إذا يجب إعتماد سكريبت يؤدي هذه العملية.............مشكلة حلها يكمن في البرمجة.
  2. هناك الآلاف من الكتب المترجمة ............لكن إفراغ النص منها ببرمجية OCR يعد معضلة ظل المبرمجون يفركون رؤوسهم من اجل حلها حتى ان بعض المشاريع في هذا السياق قد نوقفت مثل عرب أيز ARAB EYES. هناك برامج مشهورة لكن لا بد من مجهود بشري لتحسين أدائها. وهذه المشكلة تواجهها فقط اللغة العربية وحدها على حسب علمي المتواضع.
لحسن الحظ اننا وجدنا سكريبتات عديدة تسهل عملية النسخ و اللصق. لكن هناك خطوات مبدئية يجب القيام بها، وهذه طريقة إعتمدتها منذ أيام إلى حين أن تظهر فكرة لامعة جديدة، من يدري بعد قراءة المقالة مباشرة.

تكمن طريقة في الإعتماد على النقطة التي نختم بها كل جملة او فقرة، من خلال ملف برنامج notepad++ أقوم بإستبدال "." بـــ "<br>" و أحتفظ بالنص على صيغة html و هكذا يسير النص الأصلي و المترجم معدا ليشكل ذاكرة ترجمة، تذكروا هنا اننا إستعنا بخانات وهمية تحفظ كل جملة بترجمتها و إن كان على ملفان متفرقان.

لكن المشاكل تظهر من جديد إلا أن هذه المرة ستكون مشاكل طفيفة و قليلة جدا، فكما نعرف في اللغة الإنجليزية يتم إستعمال النقطة ليس فقط لختام الجملة أو الفقرة بل أيضا لإظهار صفة الشخص مثلا "Mr." أو حتى في إختصار الأسماء و الالقاب. لكن أمرها سهل كما اشارنا سابقا.
المشكلة الأخرى هي أن الترجمة قد تقدم فقرة و تؤخر أخرى و هنا يجب الإنتباه للنص المترجم.


الآن إذ اما وجدنا حلا لتفريغ النص من كتاب مترجم البي دي إف فإنه ستكون حفلة عظيمة للمترجمين، قبل أي شخص آخر، فمع توفر النص الغنجليزي و المترجم ستكون لدينا قاعدة تحتوي على الملايين من الجمل و التراكيب و التي ستمككنا من ربح 40% من وقتنا، ثم أن هناك إحتمال كبير جدا أن تجد الجمل مكررة فيقوم بترجمتها تلقائيا مستعينا بواحدة مخزنة لديه.

إلى هنا اترككم كي تفكروا في الموضوع و لا تنسوا ان تفدون بأي فكرة ترونها مثمرة.
 

Rami

عضو مشارك
إنضم
31 يناير 2012
المشاركات
2,423
الإعجابات
3,466
الإقامة
سوريا
الجنس
ذكر
#2
جميل جداً، اشكرك للشرح، لقد خطرت على بالي فكرة فور تخيلي أن أكون مكانك أثناء الترجمة، أستطيع تطبيقها برمجياً لكن لا أعلم جدواها أو إن كانت مستخدمة في أحد البرامج التي ذكرتَها، لكن إليك هذا التخيل وأعتذر على جودة الرسم:

tride.jpg
لنفرض صندوقاً لكتابة أو نسخ الجملة التي تترجمها الآن، بعد الشروع بالكتابة تبدأ الجمل المخزنة بالظهور مع تراجمها، يمكنك الضغط على السهم المخصص للجملة الصحيحة حتى تنتقل مباشرة إلى الصندوق الأسفل حيث النص الكامل بعد الترجمة.

وجدت هذه الفكرة مستخدمة بالفعل في أحد مواقع تمييز الصوت وقد كانت تجربة مثيرة فعلاً، احتجنا إلى تفريغ نصي لعدة صفحات مطبوعة، فبحثت بين المواقع ووجدت أحدها يستطيع تمييز صوت اللغة العربية وتحويله إلى نص مكتوب، لكن بعد سماعه لما تقول يقوم بإعطائك إقتراحات للجمل التي سمعها منك فقد يكون مخطئاً، وإن كان متأكداً فإنه يضع النص فوراً لك بجانب آخر جملة كتبها، وبالتالي ستحصل على النص كاملاً.

فخطرت لي نفس الفكرة بالنسبة للترجمة ولكن من الذاكرة = لا أخطاء.

شكراً.
 

lost|pages

مترجم محترف
إنضم
7 فبراير 2015
المشاركات
1,285
الإعجابات
1,652
#3
موضوع رائع, شميارو
صندوق يحوي عدة خيارات مترجمة للجملة الواحدة, هذا الأمر يتطلب سكربت أو خوارزمية. معاني الكلمات في اللغة العربية أغنى بمراحل من اللغة الأنجليزية كون العربية أقدم بكثير.هناك موقع إسمه المعاني للترجمة يعطيني معاني ومفردات الكلمات بشكل كبير وأكثر من معنى في جمل عدة.
بعد ذلك يأتي دور معنى الكلمة ومحلها من الجملة. مثلا جنَة جنُة جنِة فرق كبير بينها ولكن المترجم يستطيع أن يعرف معنى الكلمة المحددة من نوع القطعة المراد تجرمتها ومن موضوع الكتاب بشكل عام.
 

Rami

عضو مشارك
إنضم
31 يناير 2012
المشاركات
2,423
الإعجابات
3,466
الإقامة
سوريا
الجنس
ذكر
#4
نعم لكن أنا أتحدث عن جُمل جاهزة وليس كلمات مفردة.
 

ShiMauRo

محرر <a href="/forums/22">مجلة ألفا</a>
إنضم
16 مارس 2012
المشاركات
581
الإعجابات
819
#5
عن تخزين الجمل المترجمة......هذا موجود ........برامج عديدة......مثل SDL Trados و OmegaT و Fastword و العديد من البرامج ....-فضلت OmegaT لأنه صغير الحجم وذو كفاءة عالية إلا انه مبرمج بالجافا و احيانا لا يريد ان يشتغل .....لا ادري لماذا....سأستبدله........لدي SDL Trados ولكنه متعب ...........المهم البرامج موجود.

المعضلة التي اتحدث عنها هو الوقت الذي ستستغرقه لكي تنظم هذه الجمل .......جل البرامج تعمل بالجدول.......عمود النص الاصلي و عمود النص المترجم..........مثلا بنفس هذه الطريقة التي يعمل بها الموقع www.moutarjam.com لكنه فقير من ناحية النصوص المترجم........أقل ما يمكن ان أقول عليه هو انه مشروع طموح.


لنختصر الطريق لدي هذا العدد الهائل من subtitles في موقع subscene.com وغيرها، اعرف كيف أفرغ النص منها دون مشاكل ودون توقيت........فقط النص...........الآن هل هناك طريق لربط كل جملة بترجمتها من خلال سكريبت..........أم علي ان أربط كل جملة بترجمتها و كأنني اقوم بالترجمة من جديد. نص النص من الكتب امر عسير رغم جودة الترجمة العالية بها.

قضية التفريغ النصي من ملف صوتي .....أجدها لا تزال فكرة من أفكار الخيال العلمي إن لم اقل مستحيلة.......بسبب إختلاف نبرة الصوت من شخص لآخر ومن فئة عمرية لأخرى، يعني أن لكل شخص على الكوكب قاعدة بيانات خاصة بكلماته المنطوقة........لكن بعض البرامج التي انجزت في هذا المجال تتقن عملها بنسبة معية ضئيلة مثل Dragon NaturallySpeaking و لكم أن تبحثوا لتروا حجمه ومتطلباته من الرام.
 
الإعجابات: Rami

Rami

عضو مشارك
إنضم
31 يناير 2012
المشاركات
2,423
الإعجابات
3,466
الإقامة
سوريا
الجنس
ذكر
#6
نعم هناك طريقة بالتأكيد لربط الجمل، في جميع لغات البرمجة يوجد Function خاص بـ Find String Inside String ولنأخذ PHP مثلاً، لكن هل تملك الجمل كل واحدة مع ترجمتها؟ إذا كان الجواب نعم فأعتقد أن الأمر محلول بسهولة.
 

ShiMauRo

محرر <a href="/forums/22">مجلة ألفا</a>
إنضم
16 مارس 2012
المشاركات
581
الإعجابات
819
#7
نعم كل واحدة مع ترجمتها..لكن في ملفين ........مثلا ترجمة الافلام واحدة بالإنجليزية و الأخرى بالعربية ويمكن دمجهما......وتسير كل جملة مع ترجمتها في نفس الوحدة.
 

Rami

عضو مشارك
إنضم
31 يناير 2012
المشاركات
2,423
الإعجابات
3,466
الإقامة
سوريا
الجنس
ذكر
#8
حسناً أعتقد أن الأمر قابل للتطبيق حيث سيقوم السكربت بـ:
السير بين الجمل المترجمة في الملف الإنكليزي من الأولى حتى الأخيرة، والبحث عنها في النص الكامل واستبدالها بالترجمة المماثلة بالعربية من الملف العربي.
 

ShiMauRo

محرر <a href="/forums/22">مجلة ألفا</a>
إنضم
16 مارس 2012
المشاركات
581
الإعجابات
819
#9
هذه هي تقنية ذاكرة الترجمة وهي موجودة........وهم إعتمدوا صيغة TMX و غيرها كمخزون لهذه الجمل المترجمة
لكن المخزون حاليا فارغ.............ونحتاج لترتيب الجمل فيه على شكل وحدات لكي تسهل عليه عملية الإستدعاء
نحن الآن أمام النص الطويل على عدة صفحات من الوورد او تكس أو إكسيل احسن.........و امامنا في الجهة الأخرى نص طويل مترجم على عدة صفحات من الوورد او إكسيل.

الآن كيف اقسم هذا النص إلى وحدات بحيث أن كل وحدة تحتوي على الجمل الاصلية بجانبها ترجمتها...............أعتقد ان البرمجة لن تفيد هنا بالظبط.......رغم توفر النصوص فهي بحاجة للعقل البشري لتنظم........لهذا إخترت ترجمات الأفلام فهي مرتبة وفق التوقيت.و للتو عثرت على سكريبتات مثل LF_aligner_4.1 و bitext2tmx. لكنها لا تتيح لك كتابة شروط وقواعد لتقسيم النص بالطريقة التي تجدها مناسبة فهي تفترض ان النص معد و مقسم ومرتب.