Ego4D | Facebook একটি AI তৈরি করতে পারে যা আমরা যা করি তা দেখে, শোনে এবং মনে রাখে

ভবিষ্যতে, আমরা যা করি তা কি মেশিনের পক্ষে দেখা, শোনা এবং মনে রাখা সম্ভব হবে? মার্ক জুকারবার্গ কৃত্রিম বুদ্ধিমত্তার (এআই) উন্নতির জন্য বাজি ধরবেন বলে ঘোষণা করার পরে আবার পুরো বিশ্বের মনোযোগ আকর্ষণ করেছেন ।

এটি হল Ego4D, একটি Facebook প্রজেক্ট যার লক্ষ্য হল উল্লেখযোগ্যভাবে AI বিকশিত করা যতক্ষণ না এটি সমস্ত মানুষের কার্যকলাপ দেখতে, শুনতে এবং মনে রাখতে পারে৷

জুকারবার্গের সামাজিক নেটওয়ার্কের একটি বিবৃতি অনুসারে , এই প্রকল্পটি বাস্তবায়নের জন্য, সারা বিশ্ব থেকে 2,200 ঘন্টারও বেশি প্রথম ব্যক্তির ভিডিও সংগ্রহ করা হয়েছিল, 700 জনেরও বেশি অংশগ্রহণকারী যারা তাদের দৈনন্দিন জীবনকে স্বাভাবিকভাবে গড়ে তুলেছেন এবং এই তথ্য দিয়েছেন।

ফেসবুকে। লক্ষ্য ছিল পরবর্তী প্রজন্মের কৃত্রিম বুদ্ধিমত্তার মডেলদের প্রশিক্ষণ দেওয়া । বিভিন্ন দেশের প্রায় 13টি বিশ্ববিদ্যালয় এবং গবেষণাগার এই গবেষণায় অংশ নিয়েছিল।

Ego4D-এর জন্য ডেটা কীভাবে প্রাপ্ত হয়েছিল

জুকারবার্গ এই অভিনব প্রকল্পটিকে হালকাভাবে নিচ্ছেন না, যা নিঃসন্দেহে কৃত্রিম বুদ্ধিমত্তার পুরো ক্ষেত্রকে বিপ্লব এবং বিকশিত করবে। এই বিষয়ে, Facebook-এর কৃত্রিম বুদ্ধিমত্তা গবেষণা বিজ্ঞানী ক্রিস্টেন গ্রাউম্যান, ইউটিউবে Facebook AI- এর সাথে একটি সাক্ষাত্কারের সময় উল্লেখ করেছেন যে, ডেটা সংগ্রহের এই পদ্ধতিটি “স্কেল এবং বৈচিত্র্য উভয় ক্ষেত্রেই এটির প্রথম ধরণের (…)।

আমরা এই AI সিস্টেমগুলির চোখ শুধুমাত্র যুক্তরাজ্য এবং সিসিলির রান্নাঘরের চেয়ে বেশি, কিন্তু সৌদি আরব, টোকিও, লস অ্যাঞ্জেলেস এবং কলম্বিয়ার [এর ছবিগুলিতে] খুলে দিয়েছি।” অধ্যয়ন করা ক্রিয়াকলাপগুলি প্রতিদিনের ছিল: লোকেরা তাদের পোষা প্রাণীদের হাঁটা থেকে শুরু করে নির্মাণ কাজ করা ব্যক্তি পর্যন্ত। রেকর্ড করতে, GoPro ক্যামেরা এবং অগমেন্টেড রিয়েলিটি (AR) চশমা ব্যবহার করা হয়েছিল ।

এই ডাটাবেসটি এআইকে প্রথম-ব্যক্তির ডিভাইস থেকে রেকর্ড করা ছবি এবং ফটো বুঝতে শেখাতেও কাজ করবে। অন্য কথায়, ফেসবুকের এমন একটি পরিস্থিতির পূর্বাভাস দেওয়ার উচ্চাভিলাষী ধারণা রয়েছে যেখানে প্রথম ব্যক্তির ভিডিওগুলি বেশি সাধারণ। আজ, এআই সিস্টেমগুলি ফটো এবং ভিডিওগুলি থেকে ডেটা সংগ্রহ করতে পারে, তবে বাইরের কোণ থেকে দেখা হয় ।

উদাহরণস্বরূপ, এআই বর্তমানে একটি সুইমিং পুলের চিত্রটি চিনতে পারে, তবে ব্যক্তি যখন এর ভিতরে থাকে তখন সবকিছু জটিল হয়ে যায়।

ফেসবুকের লক্ষ্য এই ছবি এবং ভিডিও স্বীকৃতিকে পরবর্তী স্তরে নিয়ে যাওয়া। প্রকৃতপক্ষে, গ্রাউম্যান ব্যাখ্যা করেছেন যে “পরবর্তী প্রজন্মের AI সিস্টেমগুলিকে সম্পূর্ণ ভিন্ন ধরণের ডেটা থেকে শিখতে হবে: ভিডিওগুলি যেগুলি কর্মের কেন্দ্রস্থল থেকে বিশ্বকে দেখায় , বরং সাইডলাইন থেকে।

কিভাবে Ego4D, একটি ফেসবুক প্রকল্প, কাজ করে

Ego4D এর মাধ্যমে, Facebook, Facebook রিয়েলিটি ল্যাবস রিসার্চ (FRL Research) এর সাথে সহযোগিতায় যেমন তারা একটি বিবৃতিতে ব্যাখ্যা করেছে, বিভিন্ন পরিস্থিতিতে কাজ করতে চায় যেখানে AI সিস্টেমগুলি প্রতিক্রিয়াশীল। মোট, তারা এই প্রথম-ব্যক্তির অভিজ্ঞতার উপর দৃষ্টি নিবদ্ধ করে পাঁচটি বেঞ্চমার্ক তৈরি করেছে যা কৃত্রিম বুদ্ধিমত্তায় অগ্রগতি চালাবে:

  • এপিসোডিক মেমরি: কি ঘটেছে এবং কখন? Facebook-এর প্রকল্প, Ego4D, ব্যবহারকারীর প্রশ্নের উত্তর দিতে সক্ষম হবে “আমি আমার চাবিগুলি কোথায় রেখেছিলাম?”
  • সামাজিক মিথস্ক্রিয়া : এই সিস্টেমটি আন্তঃব্যক্তিক সম্পর্ককে আরও কার্যকর করতে সক্ষম হবে। এই ক্ষেত্রে, এটি কিছু নির্দিষ্ট যোগাযোগ বাধা, যেমন শব্দ কমাতে সাহায্য করবে।
  • পূর্বাভাস: এই AI সিস্টেমটি একজন ব্যক্তির পরবর্তী পদক্ষেপগুলি অনুমান বা ভবিষ্যদ্বাণী করতে সক্ষম হবে। সবচেয়ে ভালো ব্যাপার হল আপনার ঝুঁকিপূর্ণ বা অপ্রত্যাশিত পরিস্থিতিতে সতর্কতা দেওয়ার ক্ষমতা থাকবে। উদাহরণস্বরূপ, আপনি যদি ইতিমধ্যে একটি রেসিপিতে লবণ যোগ করে থাকেন তবে এটি আপনাকে মনে রাখতে সাহায্য করবে।
  • অডিওভিজ্যুয়াল ডায়েরি: একজন ব্যক্তির ক্রিয়াকলাপের অবিচ্ছিন্ন রেকর্ড রাখার মাধ্যমে, Ego4D মূল পরিস্থিতিগুলি মনে রাখবে, যেমন ক্লাসে কোন বিষয় কভার করা হয়েছিল বা একটি নির্দিষ্ট বিষয়ে কারও সঠিক শব্দগুলি কী ছিল।
  • হাত এবং বস্তুর ম্যানিপুলেশন: এটি সম্ভবত সবচেয়ে উন্নত ফাংশন, কারণ এটি হাত এবং বস্তুর পরিচালনাকে প্রভাবিত করবে। যদি ব্যবহারকারী “আমাকে ড্রাম বাজাতে শেখান” এর মতো কমান্ড বলে, তাহলে Ego4D স্পষ্ট নির্দেশনা দেবে, কীভাবে সঠিকভাবে হাত নাড়াতে হবে এবং এমনকি কীভাবে ড্রামের সাথে যোগাযোগ করতে হবে তা নির্দেশ করবে।

এই নতুন প্রকল্পের সুবিধা কি

Ego4D, Facebook প্রকল্প, কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে একটি নতুন নজির বপন করতে পরিবেশন করবে । এই প্রকল্পের মাধ্যমে, এটি প্রত্যাশিত যে AI দৈনন্দিন জীবনের পরিস্থিতিতে মানুষের সম্পর্কে তার উপলব্ধি উন্নত করতে পারে। এছাড়াও, ভয়েস এবং ব্যক্তিগত সহকারীর পরিচালনার জন্য নতুন সরঞ্জাম থাকবে।

এইভাবে, কোম্পানি ইঙ্গিত দিয়েছে যে “এআই যে এই দৃষ্টিকোণ থেকে বিশ্বকে বোঝে তা নিমগ্ন অভিজ্ঞতার একটি নতুন যুগ আনলক করতে পারে, যেহেতু অগমেন্টেড রিয়েলিটি গ্লাস এবং ভার্চুয়াল রিয়েলিটি হেলমেটের মতো ডিভাইসগুলি স্মার্টফোনের মতো দৈনন্দিন জীবনে খুব দরকারী হয়ে ওঠে৷

এছাড়াও, এই AI সিস্টেমের সাহায্যে, দীর্ঘমেয়াদে, এটিকে ব্যক্তিগত স্তরে ব্যক্তিগতকৃত করতে সক্ষম হতে চায়। আপনি কি কল্পনা করতে পারেন যে Ego4D সহজেই আপনার প্রিয় কাপ কফি চিনতে পারে? অথবা আপনার পরবর্তী পারিবারিক ভ্রমণের জন্য ভ্রমণসূচী একসাথে রাখুন? ফেসবুক বলছে এটা সম্ভব হবে।

এটা সব অ্যালগরিদম দেওয়া তথ্য উপর নির্ভর করে. ব্যবহারকারী সম্পর্কে যত বেশি তথ্য সংগ্রহ করা হবে, Ego4D তত বেশি সঠিক উত্তর দিতে পারে।

উপসংহার

ফেসবুক প্রকল্প, Ego4D, এটি একত্রিত হওয়ার আগে এখনও অনেক দূর যেতে হবে। কোম্পানির মতে, 2022 সালের গোড়ার দিকে গবেষকরা বিশেষজ্ঞদেরকে একটি চ্যালেঞ্জের জন্য আমন্ত্রণ জানাবেন যাতে মেশিনগুলিকে প্রথম ব্যক্তিতে বিশ্ব বুঝতে শেখানো যায়। তারা স্বেচ্ছাসেবকদের আরেকটি গ্রুপ থেকে নতুন তথ্য পাওয়ার আশা করছে।

iphone 13 pro max

যাইহোক, ফেসবুকের এই প্রকল্পটি কতটা আভাস-গার্ডে শোনাচ্ছে তা সত্ত্বেও, ইতিমধ্যে বেশ কয়েকটি বিতর্ক এবং বিতর্ক তৈরি হয়েছে। অনেক বিশেষজ্ঞ যুক্তি দেন যে Ego4D গোপনীয়তার ব্যাপক ক্ষতি করতে পারে । এছাড়াও, এই সঞ্চিত ডেটার সাথে আপোস করা হতে পারে, হ্যাকার বা দূষিত অভিপ্রায়ে থাকা কাউকে একজন ব্যক্তির গোপনীয়তায় অ্যাক্সেস পাওয়ার সুযোগ করে দেওয়ার সম্ভাবনা রয়েছে।

ধন্যবাদ।