চীন আসিয়ান ভাষা গোয়েন্দা ইনস্টিটিউট স্বাধীনভাবে একটি বহুভাষিক কর্পাস তৈরি করে
সাম্প্রতিক বছরগুলিতে, কৃত্রিম বুদ্ধিমত্তা এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ প্রযুক্তির দ্রুত বিকাশের সাথে, বহুভাষিক কর্পাস নির্মাণ ক্রস-ভাষা যোগাযোগ এবং প্রযুক্তিগত উদ্ভাবনের প্রচারের জন্য একটি গুরুত্বপূর্ণ ভিত্তি হয়ে দাঁড়িয়েছে। চীন আসিয়ান রিসার্চ ইনস্টিটিউট অফ ল্যাঙ্গুয়েজ ইন্টেলিজেন্স (এরপরে "ইনস্টিটিউট" হিসাবে উল্লেখ করা হয়েছে) সম্প্রতি ঘোষণা করেছে যে এটি দশটি আসিয়ান দেশগুলির মূল ভাষাগুলি অন্তর্ভুক্ত করে একটি বহুভাষিক কর্পাস সফলভাবে তৈরি করেছে, যার লক্ষ্য চীন এবং আসিয়ান দেশগুলির মধ্যে ভাষা আন্তঃব্যবহারযোগ্যতা, সাংস্কৃতিক প্রচার এবং বুদ্ধিমান প্রযুক্তি সহযোগিতা প্রচারের লক্ষ্যে।
এই কর্পাসের নির্মাণটি কেবল চীনের বহুভাষিক ভাষার সংস্থার ক্ষেত্রের ব্যবধান পূরণ করে না, তবে মেশিন অনুবাদ, বক্তৃতা স্বীকৃতি এবং পাঠ্য বিশ্লেষণের মতো কৃত্রিম বুদ্ধিমত্তা অ্যাপ্লিকেশনগুলির জন্য উচ্চমানের ডেটা সহায়তাও সরবরাহ করে। এই কর্পাসের প্রধান বৈশিষ্ট্য এবং ডেটাগুলির একটি ওভারভিউ এখানে:
ভাষার ধরণ | কর্পাস স্কেল (100 মিলিয়ন শব্দ) | কভারেজ অঞ্চল | ডেটা উত্স |
---|---|---|---|
চাইনিজ | 50 | সংবাদ, আইন, বিজ্ঞান এবং সাহিত্য | সরকারী প্রকাশনা, সরকারী দলিল |
থাই | 12 | সামাজিক মিডিয়া, সংবাদ, ভ্রমণ | নেটওয়ার্ক ক্রলিং এবং সমবায় প্রতিষ্ঠান দ্বারা সরবরাহ করা |
ভিয়েতনামী | 10 | অর্থনীতি, সংস্কৃতি, শিক্ষা | একাডেমিক কাগজপত্র, নিউজ মিডিয়া |
মালয় | 8 | ব্যবসা, আইন, প্রতিদিনের কথোপকথন | কর্পোরেট সহযোগিতা, অনুবাদ সংস্থা |
ইন্দোনেশিয়ান | 8 | সংবাদ, সোশ্যাল মিডিয়া, চলচ্চিত্র এবং টেলিভিশন | পাবলিক ডেটা সেট, নেটওয়ার্ক ক্রলিং |
কর্পাস অ্যাপ্লিকেশন পরিস্থিতি
এই কর্পাসের নির্মাণ একাধিক ক্ষেত্রে অ্যাপ্লিকেশনগুলির জন্য প্রাথমিক সহায়তা সরবরাহ করে, মূলত সহ:
1।মেশিন অনুবাদ: উচ্চমানের বহুভাষিক সমান্তরাল কর্পাসের মাধ্যমে, ইনস্টিটিউট একটি অনুবাদ মডেল প্রশিক্ষণ দিয়েছে যা চীনা-ইংরেজি, চীনা-থাইল্যান্ড এবং চীনা-ভিয়েতনামের মতো ভাষার জোড়কে সমর্থন করে এবং অনুবাদ নির্ভুলতা উল্লেখযোগ্যভাবে উন্নত হয়েছে।
2।ভয়েস স্বীকৃতি: কর্পাসের ভয়েস ডেটা আসিয়ান দেশগুলির স্পিচ রিকগনিশন সিস্টেমগুলির জন্য প্রশিক্ষণ উপকরণ সরবরাহ করে, বুদ্ধিমান ভয়েস সহায়ক এবং গ্রাহক পরিষেবা সিস্টেমের মতো অ্যাপ্লিকেশনগুলি বিকাশে সহায়তা করে।
3।ক্রস ভাষার তথ্য পুনরুদ্ধার: ব্যবহারকারীরা চীনা কীওয়ার্ডগুলির মাধ্যমে আসিয়ান ভাষায় সম্পর্কিত সামগ্রী অনুসন্ধান করতে পারেন, যা একাডেমিক গবেষণা এবং বাণিজ্যিক তথ্য অধিগ্রহণকে ব্যাপকভাবে সহায়তা করে।
4।সাংস্কৃতিক যোগাযোগ ও গবেষণা: কর্পাসে সাহিত্য, চলচ্চিত্র এবং টেলিভিশন সামগ্রী সাংস্কৃতিক পণ্ডিতদের সমৃদ্ধ বিশ্লেষণাত্মক উপকরণ সরবরাহ করে এবং চীন এবং আসিয়ান দেশগুলির মধ্যে সাংস্কৃতিক বিনিময় প্রচার করে।
ভবিষ্যতের পরিকল্পনা
ইনস্টিটিউট বলেছে যে কর্পাসের স্কেল এবং ভাষার ধরণগুলি ভবিষ্যতে আরও প্রসারিত করা হবে এবং বার্মিজ এবং কম্বোডিয়ানের মতো আরও আসিয়ান ছোট ছোট ভাষা অন্তর্ভুক্ত করার পরিকল্পনা রয়েছে। একই সময়ে, ইনস্টিটিউট কর্পাসের উন্মুক্ত ভাগাভাগি প্রচারের জন্য এবং বিশ্ব ভাষা গোয়েন্দা গবেষণায় অবদান রাখার জন্য আসিয়ান দেশগুলিতে একাডেমিক প্রতিষ্ঠান এবং উদ্যোগের সাথে সহযোগিতা করবে।
এই বহুভাষিক কর্পাস নির্মাণ কেবল চীন আসিয়ান ইনস্টিটিউট অফ ল্যাঙ্গুয়েজ ইন্টেলিজেন্সের একটি গুরুত্বপূর্ণ অর্জনই নয়, "বেল্ট অ্যান্ড রোড" উদ্যোগের অধীনে ভাষা আন্তঃব্যবহারযোগ্যতা এবং প্রযুক্তিগত সহযোগিতার জন্য দৃ strong ় সমর্থনও সরবরাহ করে। কৃত্রিম গোয়েন্দা প্রযুক্তির অবিচ্ছিন্ন অগ্রগতির সাথে, বহুভাষিক কর্পাসের প্রয়োগের সম্ভাবনাগুলি আরও বিস্তৃত হবে।
বিশদ পরীক্ষা করুন
বিশদ পরীক্ষা করুন