Bangla subtitles for clip: File:Ikusgela-Hizkuntza prozesamendua.webm

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
1
00:00:03,290 --> 00:00:06,576
একটি পৃথিবী কল্পনা করুন যেখানে
আমরা সমস্ত তথ্য আমাদের পছন্দের ভাষায় পাচ্ছি।

2
00:00:06,601 --> 00:00:08,800
যা কিছু আমরা ইন্টারনেটে খুঁজছি,

3
00:00:08,900 --> 00:00:10,300
আমাদের ইলেকট্রনিক ডিভাইসগুলোতে,

4
00:00:10,440 --> 00:00:11,746
কোনো বই,

5
00:00:11,770 --> 00:00:12,725
এমনকি, আমাদের সামনে থাকা
ব্যক্তি যা বলছে তাও।

6
00:00:12,750 --> 00:00:15,390
ভাবুন, আপনি যেকোনো ব্যক্তির
সঙ্গে ভাষার সীমাবদ্ধতা ছাড়াই কথা বলতে পারবেন।

7
00:00:15,550 --> 00:00:18,259
আর সম্ভবত, নতুন ভাষা শেখার
প্রবণতা ক্রমশ হ্রাস পাবে।

8
00:00:18,283 --> 00:00:19,763
আমরা এখনো সেই পর্যায়ে পৌঁছাইনি

9
00:00:19,787 --> 00:00:24,700
কিন্তু এটা হয়তো খুব একটা দূরেও নয়।

10
00:00:24,725 --> 00:00:26,218
আর সেই আসন্ন বিপ্লবের
প্রভাব প্রতিটি ভাষার ওপরই পড়বে।

11
00:00:26,242 --> 00:00:28,621
অবশ্যই, ছোট ভাষাগুলোতে তার
প্রভাব বেশি পড়বে।

12
00:00:28,645 --> 00:00:32,080
এবং আমরা যারা এই ভাষাগুলি
বলে থাকি, তাদের ওপরও

13
00:00:32,140 --> 00:00:34,177
এটা ভাষাপ্রকৌশলের
একটি শাখা

14
00:00:34,201 --> 00:00:35,840
যেখানে ভাষাবিজ্ঞান ও
তথ্যপ্রযুক্তি মিলিত হয়েছে।

15
00:00:43,550 --> 00:00:46,082
প্রাকৃতিক ভাষার প্রক্রিয়াকরণে

16
00:00:46,106 --> 00:00:49,062
ভাষাবিজ্ঞান ও
তথ্যপ্রযুক্তি একত্রে কাজ করে

17
00:00:49,088 --> 00:00:53,645
এটি সংক্ষেপে NLP (Natural Language Processing)
বলে পরিচিত।

18
00:00:53,670 --> 00:00:54,596
সংক্ষেপে,

19
00:00:54,621 --> 00:01:00,170
এটি মানুষের সঙ্গে যন্ত্রের
যোগাযোগ উন্নত করার পদ্ধতি নিয়ে কাজ করে।

20
00:01:00,194 --> 00:01:03,630
এবং এই বিষয়ে প্রশিক্ষিত গবেষক
ও কোম্পানি আমাদের এখানেই আছে,

21
00:01:03,680 --> 00:01:04,645
বাস্ক দেশে।

22
00:01:04,670 --> 00:01:08,113
যেমন, স্বয়ংক্রিয় বানান পরীক্ষক
বা অনুবাদ সরঞ্জাম তৈরি করা হয়েছে

23
00:01:08,137 --> 00:01:10,500
প্রাকৃতিক ভাষার
প্রক্রিয়াকরণের মাধ্যমে।

24
00:01:10,708 --> 00:01:12,332
আর এই ক্ষেত্রে, বাস্ক ভাষা

25
00:01:12,421 --> 00:01:15,213
অনেক ভাষার তুলনায়
আরও এগিয়ে আছে।

26
00:01:15,530 --> 00:01:18,478
কয়েক বছর আগেও, অনুবাদ
প্রযুক্তি শব্দ গণনা

27
00:01:18,502 --> 00:01:21,082
এবং সম্ভাবনা অনুমান করার ওপর নির্ভর করতো।

28
00:01:21,106 --> 00:01:23,860
অনুবাদ স্মৃতিতে সংরক্ষণ করা
অনুবাদগুলো বিশ্লেষণ করা,

29
00:01:23,910 --> 00:01:27,660
শব্দগুলো কীভাবে অনুবাদ
হয়েছে তা হিসাব করা, এবং নতুন একটি পাঠ্য অনুবাদ করার সময়,

30
00:01:27,860 --> 00:01:31,095
সেই তথ্যগুলো ব্যবহার করে
সম্ভাব্য অনুবাদ তৈরি করা হত।

31
00:01:31,119 --> 00:01:33,903
এটা আশ্চর্যজনক নয় যে এই
পদ্ধতিগুলো বাক্য গঠন বা
বহুঅর্থবোধক শব্দ

32
00:01:33,927 --> 00:01:36,530
অনুবাদ করতে কিছুটা জটিলতা সৃষ্টি করে।

33
00:01:36,640 --> 00:01:40,112
কিন্তু ভাষা প্রযুক্তি
সবসময়ই পরিবর্তন প্রক্রিয়ার মধ্যে রয়েছে।

34
00:01:40,136 --> 00:01:41,620
আর বিগত কয়েক বছরে,

35
00:01:41,645 --> 00:01:44,121
একটা কিছু ঘটেছে যা নতুন পরিবর্তনের জন্ম দিয়েছে:

36
00:01:44,290 --> 00:01:46,105
এটি হলো কৃত্রিম বুদ্ধিমত্তার উন্নতি।

37
00:01:46,130 --> 00:01:48,611
আমি অন্য একটি ভিডিওতে
এই বিষয়ে বিশদভাবে ব্যাখ্যা করেছি।

38
00:01:48,809 --> 00:01:52,305
কৃত্রিম বুদ্ধিমত্তা মানুষের
বুদ্ধিমত্তার অনুকরণ করার চেষ্টা করে।

39
00:01:52,329 --> 00:01:55,899
আর মানুষের বুদ্ধিমত্তার
দুটি অন্যতম পরিচিত দিক হলো

40
00:01:55,923 --> 00:01:58,270
ভাষা বুঝতে এবং
ব্যবহার করতে পারা।

41
00:01:58,580 --> 00:01:59,315
তাই,

42
00:01:59,340 --> 00:02:04,613
প্রাকৃতিক ভাষার প্রক্রিয়াকরণ
কৃত্রিম বুদ্ধিমত্তার কেন্দ্রবিন্দু।

43
00:02:04,638 --> 00:02:09,490
প্রত্যেক ভাষার তথ্য এবং নিয়মগুলো
হাতে ম্যানুয়ালি প্রবেশ করানোর বদলে,

44
00:02:09,690 --> 00:02:11,990
আমরা স্বয়ংক্রিয়
প্রশিক্ষণের দিকে এগিয়ে যাচ্ছি।

45
00:02:12,015 --> 00:02:15,776
আজকের দিনে, প্রোগ্রামগুলো
উদাহরণের মাধ্যমে শেখে,

46
00:02:15,800 --> 00:02:19,013
এবং তাদের নিজস্ব অ্যালগরিদম তৈরি করে
সেই জ্ঞান অন্য ক্ষেত্রে প্রয়োগ করে।

47
00:02:19,038 --> 00:02:23,039
আরো সঠিকভাবে বলতে গেলে-
ডিপ লার্নিং নামক একটি কৌশলের মাধ্যমে,

48
00:02:23,064 --> 00:02:26,050
শুধু উদাহরণ থেকে শেখা নয়,

49
00:02:26,280 --> 00:02:29,403
তাদের প্রাপ্ত তথ্য থেকে
উপসংহারও বের করতে পারে

50
00:02:29,427 --> 00:02:32,339
এবং নতুন অ্যালগরিদম তৈরি করতে পারে।

51
00:02:32,364 --> 00:02:33,620
এবং এর মানে কী?

52
00:02:33,689 --> 00:02:36,658
এর মানে যন্ত্রগুলো
আগের থেকে অনেক দ্রুত শিখতে পারে,

53
00:02:36,682 --> 00:02:41,234
এবং সঠিক ডেটার সাহায্যে
অনেক ভালো ফলাফল দিতে পারে।

54
00:02:41,259 --> 00:02:42,491
কিছু বছর আগেও

55
00:02:42,540 --> 00:02:45,296
যা চিন্তা করা অসম্ভব ছিল,
এখন তা সম্ভব হয়েছে।

56
00:02:45,321 --> 00:02:49,690
কিছু সরঞ্জাম এমহন রয়েছে যা সরাসরি মৌখিক বার্তাগুলোকে লেখা আকারে নিয়ে আসে।

57
00:02:49,710 --> 00:02:52,530
স্বয়ংক্রিয়ভাবে সাবটাইটেল তৈরি করার মতো কাজ করে

58
00:02:52,770 --> 00:02:53,770
এবং কিছু সরঞ্জাম

59
00:02:53,872 --> 00:02:56,701
এই টেক্সটগুলোকে স্বয়ংক্রিয়ভাবে অনুবাদ করে।

60
00:02:56,725 --> 00:03:01,002
উল্টোটাও সম্ভব: একটি টেক্সট নিয়ে তা শব্দে রূপান্তরিত করা।

61
00:03:01,070 --> 00:03:04,540
ধীরে ধীরে, এই সরঞ্জামগুলো আরও বেশি উন্নত হচ্ছে,

62
00:03:04,560 --> 00:03:07,861
আর খুব শীঘ্রই আপনি সরাসরি শোনা সেই বার্তাগুলোকে স্বয়ংক্রিয়ভাবে

63
00:03:07,885 --> 00:03:10,841
অন্য ভাষায় ডাব করা আকারে পেতে সক্ষম হবেন।

64
00:03:10,865 --> 00:03:12,025
অথবা অন্তত,

65
00:03:12,050 --> 00:03:13,730
আগের মতো আর অসম্ভব মনে হবে না।

66
00:03:14,180 --> 00:03:16,850
কিন্তু এটা কি সব ভাষার জন্য সমানভাবে কাজ করে?

67
00:03:17,060 --> 00:03:19,413
না, এবং এটাই আমাদের চ্যালেঞ্জ।

68
00:03:19,437 --> 00:03:22,683
এই সরঞ্জামগুলো কার্যকর হতে হলে লক্ষ লক্ষ ডেটার প্রয়োজন হয়,

69
00:03:22,707 --> 00:03:26,470
এবং প্রতিটি ভাষার জন্য নিজস্ব অ্যালগরিদম তৈরি করতে হয়।

70
00:03:26,661 --> 00:03:27,300
এই মুহূর্তে,

71
00:03:27,320 --> 00:03:31,040
অধিকাংশ নতুন সরঞ্জাম প্রধানত প্রভাবশালী ভাষাযগুলোতে তৈরি হয়েছে

72
00:03:31,190 --> 00:03:33,029
যেমন ChatGPT বা Dalle2,

73
00:03:33,053 --> 00:03:37,600
আমরা ইংরেজি এবং স্প্যানিশে ব্যবহার করতে পারি, কিন্তু বাস্ক ভাষায় তেমনটা নয়

74
00:03:37,680 --> 00:03:41,355
একই জিনিস ঘটে সেই ডিভাইসগুলোর ক্ষেত্রেও যা মৌখিক ভাষা শনাক্ত করতে ও বুঝতে সক্ষম।

75
00:03:41,379 --> 00:03:45,190
আজকের দিনে দাঁড়িয়ে, বাস্ক ভাষা এখনও অন্য ভাষার সমপর্যায়ে নেই

76
00:03:45,430 --> 00:03:47,538
কিন্তু এটা সবসময় এমন থাকবে না।

77
00:03:47,562 --> 00:03:52,040
যেমন আমি বলেছি, অনেক প্রকল্প রয়েছে যারা বাস্ক অঞ্চলে এই ক্ষেত্রে কাজ করছে

78
00:03:52,300 --> 00:03:55,217
IXA দল, Orai, Eleka, Matxin…

79
00:03:55,281 --> 00:03:57,047
এবং আরো অনেকে কাজ করছে,

80
00:03:57,083 --> 00:03:58,459
যাতে বাস্ক ভাষাও তার স্থান পায়

81
00:03:58,483 --> 00:04:02,043
কৃত্রিম বুদ্ধিমত্তার মাধ্যমে আসা নতুন সম্ভাবনায়

82
00:04:02,180 --> 00:04:05,710
আমি এমন একটি কথা বলবো যা আমি অনেকের কাছেই শুনেছি, যেন এটা আমারই কথা:

83
00:04:05,800 --> 00:04:07,370
সংখ্যালঘু ভাষাগুলোর মধ্যে

84
00:04:07,439 --> 00:04:12,379
অগ্রদূত এবং পথপ্রদর্শক হওয়ার জন্য আমাদের কাছে পেশাদার এবং দক্ষতা রয়েছে।

85
00:04:12,480 --> 00:04:13,590
আমরা কি সেই স্রোতের সাথে তাল মেলাতে পারব?