Bangla subtitles for clip: File:Ikusgela-Hizkuntza prozesamendua.webm
Jump to navigation
Jump to search
1 00:00:03,290 --> 00:00:06,576 একটি পৃথিবী কল্পনা করুন যেখানে আমরা সমস্ত তথ্য আমাদের পছন্দের ভাষায় পাচ্ছি। 2 00:00:06,601 --> 00:00:08,800 যা কিছু আমরা ইন্টারনেটে খুঁজছি, 3 00:00:08,900 --> 00:00:10,300 আমাদের ইলেকট্রনিক ডিভাইসগুলোতে, 4 00:00:10,440 --> 00:00:11,746 কোনো বই, 5 00:00:11,770 --> 00:00:12,725 এমনকি, আমাদের সামনে থাকা ব্যক্তি যা বলছে তাও। 6 00:00:12,750 --> 00:00:15,390 ভাবুন, আপনি যেকোনো ব্যক্তির সঙ্গে ভাষার সীমাবদ্ধতা ছাড়াই কথা বলতে পারবেন। 7 00:00:15,550 --> 00:00:18,259 আর সম্ভবত, নতুন ভাষা শেখার প্রবণতা ক্রমশ হ্রাস পাবে। 8 00:00:18,283 --> 00:00:19,763 আমরা এখনো সেই পর্যায়ে পৌঁছাইনি 9 00:00:19,787 --> 00:00:24,700 কিন্তু এটা হয়তো খুব একটা দূরেও নয়। 10 00:00:24,725 --> 00:00:26,218 আর সেই আসন্ন বিপ্লবের প্রভাব প্রতিটি ভাষার ওপরই পড়বে। 11 00:00:26,242 --> 00:00:28,621 অবশ্যই, ছোট ভাষাগুলোতে তার প্রভাব বেশি পড়বে। 12 00:00:28,645 --> 00:00:32,080 এবং আমরা যারা এই ভাষাগুলি বলে থাকি, তাদের ওপরও 13 00:00:32,140 --> 00:00:34,177 এটা ভাষাপ্রকৌশলের একটি শাখা 14 00:00:34,201 --> 00:00:35,840 যেখানে ভাষাবিজ্ঞান ও তথ্যপ্রযুক্তি মিলিত হয়েছে। 15 00:00:43,550 --> 00:00:46,082 প্রাকৃতিক ভাষার প্রক্রিয়াকরণে 16 00:00:46,106 --> 00:00:49,062 ভাষাবিজ্ঞান ও তথ্যপ্রযুক্তি একত্রে কাজ করে 17 00:00:49,088 --> 00:00:53,645 এটি সংক্ষেপে NLP (Natural Language Processing) বলে পরিচিত। 18 00:00:53,670 --> 00:00:54,596 সংক্ষেপে, 19 00:00:54,621 --> 00:01:00,170 এটি মানুষের সঙ্গে যন্ত্রের যোগাযোগ উন্নত করার পদ্ধতি নিয়ে কাজ করে। 20 00:01:00,194 --> 00:01:03,630 এবং এই বিষয়ে প্রশিক্ষিত গবেষক ও কোম্পানি আমাদের এখানেই আছে, 21 00:01:03,680 --> 00:01:04,645 বাস্ক দেশে। 22 00:01:04,670 --> 00:01:08,113 যেমন, স্বয়ংক্রিয় বানান পরীক্ষক বা অনুবাদ সরঞ্জাম তৈরি করা হয়েছে 23 00:01:08,137 --> 00:01:10,500 প্রাকৃতিক ভাষার প্রক্রিয়াকরণের মাধ্যমে। 24 00:01:10,708 --> 00:01:12,332 আর এই ক্ষেত্রে, বাস্ক ভাষা 25 00:01:12,421 --> 00:01:15,213 অনেক ভাষার তুলনায় আরও এগিয়ে আছে। 26 00:01:15,530 --> 00:01:18,478 কয়েক বছর আগেও, অনুবাদ প্রযুক্তি শব্দ গণনা 27 00:01:18,502 --> 00:01:21,082 এবং সম্ভাবনা অনুমান করার ওপর নির্ভর করতো। 28 00:01:21,106 --> 00:01:23,860 অনুবাদ স্মৃতিতে সংরক্ষণ করা অনুবাদগুলো বিশ্লেষণ করা, 29 00:01:23,910 --> 00:01:27,660 শব্দগুলো কীভাবে অনুবাদ হয়েছে তা হিসাব করা, এবং নতুন একটি পাঠ্য অনুবাদ করার সময়, 30 00:01:27,860 --> 00:01:31,095 সেই তথ্যগুলো ব্যবহার করে সম্ভাব্য অনুবাদ তৈরি করা হত। 31 00:01:31,119 --> 00:01:33,903 এটা আশ্চর্যজনক নয় যে এই পদ্ধতিগুলো বাক্য গঠন বা বহুঅর্থবোধক শব্দ 32 00:01:33,927 --> 00:01:36,530 অনুবাদ করতে কিছুটা জটিলতা সৃষ্টি করে। 33 00:01:36,640 --> 00:01:40,112 কিন্তু ভাষা প্রযুক্তি সবসময়ই পরিবর্তন প্রক্রিয়ার মধ্যে রয়েছে। 34 00:01:40,136 --> 00:01:41,620 আর বিগত কয়েক বছরে, 35 00:01:41,645 --> 00:01:44,121 একটা কিছু ঘটেছে যা নতুন পরিবর্তনের জন্ম দিয়েছে: 36 00:01:44,290 --> 00:01:46,105 এটি হলো কৃত্রিম বুদ্ধিমত্তার উন্নতি। 37 00:01:46,130 --> 00:01:48,611 আমি অন্য একটি ভিডিওতে এই বিষয়ে বিশদভাবে ব্যাখ্যা করেছি। 38 00:01:48,809 --> 00:01:52,305 কৃত্রিম বুদ্ধিমত্তা মানুষের বুদ্ধিমত্তার অনুকরণ করার চেষ্টা করে। 39 00:01:52,329 --> 00:01:55,899 আর মানুষের বুদ্ধিমত্তার দুটি অন্যতম পরিচিত দিক হলো 40 00:01:55,923 --> 00:01:58,270 ভাষা বুঝতে এবং ব্যবহার করতে পারা। 41 00:01:58,580 --> 00:01:59,315 তাই, 42 00:01:59,340 --> 00:02:04,613 প্রাকৃতিক ভাষার প্রক্রিয়াকরণ কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দু। 43 00:02:04,638 --> 00:02:09,490 প্রত্যেক ভাষার তথ্য এবং নিয়মগুলো হাতে ম্যানুয়ালি প্রবেশ করানোর বদলে, 44 00:02:09,690 --> 00:02:11,990 আমরা স্বয়ংক্রিয় প্রশিক্ষণের দিকে এগিয়ে যাচ্ছি। 45 00:02:12,015 --> 00:02:15,776 আজকের দিনে, প্রোগ্রামগুলো উদাহরণের মাধ্যমে শেখে, 46 00:02:15,800 --> 00:02:19,013 এবং তাদের নিজস্ব অ্যালগরিদম তৈরি করে সেই জ্ঞান অন্য ক্ষেত্রে প্রয়োগ করে। 47 00:02:19,038 --> 00:02:23,039 আরো সঠিকভাবে বলতে গেলে- ডিপ লার্নিং নামক একটি কৌশলের মাধ্যমে, 48 00:02:23,064 --> 00:02:26,050 শুধু উদাহরণ থেকে শেখা নয়, 49 00:02:26,280 --> 00:02:29,403 তাদের প্রাপ্ত তথ্য থেকে উপসংহারও বের করতে পারে 50 00:02:29,427 --> 00:02:32,339 এবং নতুন অ্যালগরিদম তৈরি করতে পারে। 51 00:02:32,364 --> 00:02:33,620 এবং এর মানে কী? 52 00:02:33,689 --> 00:02:36,658 এর মানে যন্ত্রগুলো আগের থেকে অনেক দ্রুত শিখতে পারে, 53 00:02:36,682 --> 00:02:41,234 এবং সঠিক ডেটার সাহায্যে অনেক ভালো ফলাফল দিতে পারে। 54 00:02:41,259 --> 00:02:42,491 কিছু বছর আগেও 55 00:02:42,540 --> 00:02:45,296 যা চিন্তা করা অসম্ভব ছিল, এখন তা সম্ভব হয়েছে। 56 00:02:45,321 --> 00:02:49,690 কিছু সরঞ্জাম এমহন রয়েছে যা সরাসরি মৌখিক বার্তাগুলোকে লেখা আকারে নিয়ে আসে। 57 00:02:49,710 --> 00:02:52,530 স্বয়ংক্রিয়ভাবে সাবটাইটেল তৈরি করার মতো কাজ করে 58 00:02:52,770 --> 00:02:53,770 এবং কিছু সরঞ্জাম 59 00:02:53,872 --> 00:02:56,701 এই টেক্সটগুলোকে স্বয়ংক্রিয়ভাবে অনুবাদ করে। 60 00:02:56,725 --> 00:03:01,002 উল্টোটাও সম্ভব: একটি টেক্সট নিয়ে তা শব্দে রূপান্তরিত করা। 61 00:03:01,070 --> 00:03:04,540 ধীরে ধীরে, এই সরঞ্জামগুলো আরও বেশি উন্নত হচ্ছে, 62 00:03:04,560 --> 00:03:07,861 আর খুব শীঘ্রই আপনি সরাসরি শোনা সেই বার্তাগুলোকে স্বয়ংক্রিয়ভাবে 63 00:03:07,885 --> 00:03:10,841 অন্য ভাষায় ডাব করা আকারে পেতে সক্ষম হবেন। 64 00:03:10,865 --> 00:03:12,025 অথবা অন্তত, 65 00:03:12,050 --> 00:03:13,730 আগের মতো আর অসম্ভব মনে হবে না। 66 00:03:14,180 --> 00:03:16,850 কিন্তু এটা কি সব ভাষার জন্য সমানভাবে কাজ করে? 67 00:03:17,060 --> 00:03:19,413 না, এবং এটাই আমাদের চ্যালেঞ্জ। 68 00:03:19,437 --> 00:03:22,683 এই সরঞ্জামগুলো কার্যকর হতে হলে লক্ষ লক্ষ ডেটার প্রয়োজন হয়, 69 00:03:22,707 --> 00:03:26,470 এবং প্রতিটি ভাষার জন্য নিজস্ব অ্যালগরিদম তৈরি করতে হয়। 70 00:03:26,661 --> 00:03:27,300 এই মুহূর্তে, 71 00:03:27,320 --> 00:03:31,040 অধিকাংশ নতুন সরঞ্জাম প্রধানত প্রভাবশালী ভাষাযগুলোতে তৈরি হয়েছে 72 00:03:31,190 --> 00:03:33,029 যেমন ChatGPT বা Dalle2, 73 00:03:33,053 --> 00:03:37,600 আমরা ইংরেজি এবং স্প্যানিশে ব্যবহার করতে পারি, কিন্তু বাস্ক ভাষায় তেমনটা নয় 74 00:03:37,680 --> 00:03:41,355 একই জিনিস ঘটে সেই ডিভাইসগুলোর ক্ষেত্রেও যা মৌখিক ভাষা শনাক্ত করতে ও বুঝতে সক্ষম। 75 00:03:41,379 --> 00:03:45,190 আজকের দিনে দাঁড়িয়ে, বাস্ক ভাষা এখনও অন্য ভাষার সমপর্যায়ে নেই 76 00:03:45,430 --> 00:03:47,538 কিন্তু এটা সবসময় এমন থাকবে না। 77 00:03:47,562 --> 00:03:52,040 যেমন আমি বলেছি, অনেক প্রকল্প রয়েছে যারা বাস্ক অঞ্চলে এই ক্ষেত্রে কাজ করছে 78 00:03:52,300 --> 00:03:55,217 IXA দল, Orai, Eleka, Matxin… 79 00:03:55,281 --> 00:03:57,047 এবং আরো অনেকে কাজ করছে, 80 00:03:57,083 --> 00:03:58,459 যাতে বাস্ক ভাষাও তার স্থান পায় 81 00:03:58,483 --> 00:04:02,043 কৃত্রিম বুদ্ধিমত্তার মাধ্যমে আসা নতুন সম্ভাবনায় 82 00:04:02,180 --> 00:04:05,710 আমি এমন একটি কথা বলবো যা আমি অনেকের কাছেই শুনেছি, যেন এটা আমারই কথা: 83 00:04:05,800 --> 00:04:07,370 সংখ্যালঘু ভাষাগুলোর মধ্যে 84 00:04:07,439 --> 00:04:12,379 অগ্রদূত এবং পথপ্রদর্শক হওয়ার জন্য আমাদের কাছে পেশাদার এবং দক্ষতা রয়েছে। 85 00:04:12,480 --> 00:04:13,590 আমরা কি সেই স্রোতের সাথে তাল মেলাতে পারব?