জীববিজ্ঞানের সমস্যা সমাধানে কৃত্রিম বুদ্ধিমত্তা

অনলাইন ডেস্ক।।

জীবনকে বুঝতে হলে অতি অবশ্যই প্রোটিনকে বুঝতে হবে। প্রোটিন হলো মলিকুলের শিকল। প্রতিটি প্রোটিন এ্যামাইনো এ্যাসিড নামে পরিচিত ২০ ধরনের রাসায়নিক সংযোগের জীববিজ্ঞানের ভারী জিনিস তোলার কাজ করে। এনজাইমের ছদ্মবেশে তারা শরীর সচল রাখার রসায়নে অনুঘোটকের কাজ করে। একটিন ও মায়োসিন হলো মাসল বা পেশীর প্রোটিন যা পেশীকে চারদিকে সঞ্চালিত হওয়ার সুযোগ দেয়। কেরাটিন নামক প্রোটিন পেশীর গায়ে ত্বক ও লোম জোগায়। হিমোগ্লোবিন শরীরের প্রতিটি কোষে অক্সিজেন বয়ে নিয়ে যায়। ইনসুলিন শরীরের বিপাকক্রিয়া নিয়ন্ত্রণ করে। আর স্পাইক নামে একটা প্রোটিন করোনাভাইরাসকে মানবদেহের কোষগুলোকে আক্রমণের সুযোগ করে দেয়।

এ্যামাইনো এ্যাসিডের প্রোটিনগুলোর তালিকা করা সহজ। এ কাজ করার জন্য মেশিনের অস্তিত্ব কয়েক দশক আগে থেকেই রয়েছে। তবে প্রোটিন কিভাবে কাজ করে তা জানার অন্বেষায় এ হলো লড়াইয়ের অর্ধেক মাত্র। প্রোটিন কি কাজ করে এবং কিভাবে করে তা এটি সৃষ্টি হওয়ার পর চূড়ান্ত ও জটিল রূপটি কিভাবে ধারণ করে তার ওপরও নির্ভর করে।

এ মুহূর্তে মলিকুলার বায়োলজিস্টরা এক্স-রে ক্রিস্টালোগ্রাফির মতো কৌশলগুলো কাজে লাগিয়ে পরীক্ষামূলকভাবে প্রোটিনের আকার-আকৃতির হদিস বের করতে পারে। তবে ব্যাপার ঝামেলাপূর্ণ এবং এতে বেশ সময় লাগে। এখন এ কাজই অনেক সহজে করার কৌশল বের হওয়ার উপক্রম হয়েছে। গুগলের পেরেন্ট কোম্পানি এলফাবেটের মালিকানাধীন কৃত্রিম বুদ্ধিমত্তার ল্যাবরেটরি ‘ডিমমাইন্ড’-এর গবেষকরা গত ৩০ নবেম্বর তাদের এক গবেষণার ফলাফল তুলে ধরেছেন। তা থেকে বোঝা যায় যে জীববিজ্ঞানের সবচেয়ে বড় একটি চ্যালেঞ্জের সমাধানে তারা বিশাল অগ্রগতি অর্জন করেছেন। আর সেটা হলো এ্যামাইনো এ্যাসিডের উপাদানগুলোর তালিকা থেকে একটি প্রোটিনের আকার-আকৃতি আগে থেকে বলে দেয়ার জন্য কম্পিউটারকে কিভাবে ব্যবহার করা যায়।

প্রকৃতপক্ষে এ এক বিশাল অর্জন। কয়েক মাসের পরীক্ষা-নিরীক্ষার পরিবর্তে কম্পিউটারে কয়েক ঘণ্টা সময় ব্যয় করে দেহকোষগুলোর ভেতরের কাজকর্মের ওপর নতুন আলোকপাত ঘটানো যেতে পারে। এতে ওষুধ উদ্ভাবনের কাজ ত্বরান্বিত হতে পারে। এ থেকে আলঝেইমারের মতো রোগ-ব্যাধির চিকিৎসার পথ বের হতে পারে। এ ধরনের রোগে আকার-আকৃতি বিকৃত হয়ে যাওয়া প্রোটিনগুলোর ভূমিকা আছে বলে মনে করা হয়।

তবে এটাই সব কথা নয়। এর সঙ্গে আরও কিছু আছে। ব্রিটেনের কৃত্রিম বুদ্ধিমত্তা কোম্পানি ‘ডিপমাইন্ড টেকনোলজিস’ একটি দল প্রোটিনের ফোল্ডিং সমস্যা মোকাবেলায় মেশিন-লার্নিং কৌশল ব্যবহার করেছে। প্রোটিনের আকার-আকৃতি আগে থেকে বলে দেয়ার কাজে কম্পিউটার ব্যবহারের ধারণাটি অর্ধশতাব্দীর পুরনো। এ ব্যাপারে বাস্তব অগ্রগতি হয়েছে বটে। তবে তা মন্থরগতিতে। এক্ষেত্রে ভুলভ্রান্তির ইতিহাসও আছে এবং সময় হওয়ার আগেই সাফল্য দাবি করা হয়েছে এমন ঘটনাও আছে।

হালে জীববিজ্ঞানের অন্যতম চ্যালেঞ্জিং একটি কাজ প্রোটিনের আকার-আকৃতি আগে থেকে বলে দেয়ার ব্যাপারটি একটি নির্দিষ্ট ক্ষেত্রে এলগোরিদম কতটা ভালভাবে কাজ করে তার দ্বারা নিরুপিত হয়। এই নির্দিষ্ট ক্ষেত্রকে বলা হয় ক্রিটিক্যাল এ্যাসেসমেন্ট অব প্রোটিন স্ট্রাকচার প্রেডিকশন (সিএএসপি)। এটা হলো দ্বিবার্ষিক গবেষণা ও প্রতিযোগিতা যা শুরু হয়েছিল ১৯৯৪ সালে। একে কৌতুক করে নাম দেয়া হয়েছে ‘অলিম্পিক অব প্রোটিন ফোল্ডিং।’ এতে বেশ কিছু প্রোটিনের আকার-আকৃতির পূর্বাভাস দেয়ার ক্ষমতা এলগোরিদমগুলোর আছে কিনা তা অন্ধভাবে পরীক্ষা করে দেখা হয়।

সিএএসপিতে ডিপমাইন্ডের প্রথম প্রবেশ ঘটে দু’বছর আগে। তখন এর নাম দেয়া হয়েছিল আলফাফোল্ড। তখনকার অন্য আর সব প্রোগ্রামের তুলনায় এটি অনেক ভাল ফল দিয়ে সাড়া ফেলেছিল। বর্তমান ভার্সন আলফাফোল্ড-২ সেই সাফল্যকে আরও এগিয়ে নিয়ে গিয়েছে। এর আগ পর্যন্ত ‘ডিপমাইন্ড’ গেমস বিশেষ করে ‘গো’ গেম খেলতে কম্পিউটারকে শেখানোর কাজে তার সাফল্যের জন্য সর্বাধিক পরিচিত ছিল। ‘গো‘ খেলার কৌশল বাহ্যত সহজ দেখালেও আসলে তা ছিল জটিল। ২০১৬ সালে ‘ডিপমাইন্ড’ আলফা গো’ নামে এক প্রোগ্রাম বিশ্বের সেরা ‘গো’ খেলোয়াড়দের অন্যতম লী সিডলকে হারিয়ে দিয়েছিল। বাহ্যিকভাবে দেখলে এর তেমন তাৎপর্য নেই মনে হলেও ‘ডিপমাইন্ড’-এর প্রধান ড. ডেমিস হাসাবিসের মতে প্রোটিনের ভাঁজ খাওয়া এবং ‘গো’ খেলাÑএই দুইয়ের মধ্যে অধিকতর সাদৃশ্য আছে। একটি সাদৃশ্য হলো এই যে কম্পিউটারের পাশবিক বল দিয়ে উভয়ের সমস্যার সমাধান করা বাস্তবসম্মত নয়। ১০ কে ১০ দিয়ে ১৭০ বার গুণ করলে যে সংখ্যা দাঁড়ায় গো বোর্ডে প্রায় সমসংখ্যক স্টোনের বিন্যাস আছে। মহাবিশ্বে যত সংখ্যক এটম আছে এটা তার চেয়েও অনেক বেশি। এই সংখ্যাটা যে কোন কম্পিউটারের আওতার বাইরে যদি না কম্পিউটেশনাল কোন শর্টকাট পথ বের করা যায়।

প্রোটিন হলো ‘গো’ গেমের চেয়েও জটিল। এক হিসাবে দেখা গেছে যে মোটামুটিভাবে জটিল একটা প্রোটিন ১০ কে ১০ দিয়ে ৩০০ বার গুণ করলে যা দাঁড়ায় সেই সংখ্যক ভিন্ন ভিন্ন ধরনের আকার-আকৃতির মধ্যে যে কোন একটি আকার ধারণ করতে পারে। প্রোটিন শেষ পর্যন্ত যে আকৃতি ধারণ করে সেটা হচ্ছে এ্যামাইনো এ্যাসিড বিল্ডিং ব্লকের ভেতরে ক্রিয়াশীল এটম পরিসরের বিভিন্ন শক্তির ভারসাম্যের পরিণতি। এটা যথেষ্ট জটিল এক ব্যাপার যার পরিমাপ করা কঠিন। তাই এটা পরিষ্কার যে ‘গো’ খেলার মতো প্রোটিন ফোল্ডিং ভবিষ্যদ্বাণী করার জটিল কাজটা সম্পাদন করার একমাত্র উপায় হলো শর্টকাট পথের সন্ধান করা।

গত কয়েক বছর ধরে কম্পিউটারে এই সমস্যা সমাধানের চেষ্টায় যে অগ্রগতি হয়েছে তা থেকে দেখা যায় যে, এসব শর্টকাট পথের অস্তিত্ব আছে। আরও জানা গেছে যে, আনাড়ি ব্যক্তিরাও খেলতে খেলতে এসব কৌশল শিখতে পারে। ড. হাসাবিস উল্লেখ করেছেন যে, তিনি ফোল্ডইট নামে বিজ্ঞানমুখী একটি ভিডিও গেমের সহায়তায় সৌখিন ব্যক্তিদের প্রোটিন উন্মোচিত করার ক্ষমতা দেখে স্তম্ভিত হয়ে গিয়েছিলেন। ২০০৮ সালে চালু হওয়া এই ভিডিও গেমটিতে খেলোয়াড়দের নিজেদেরই প্রোটিনকে ভাঁজ করার চেষ্টা করতে বলা হয়েছে। সেই চেষ্টা করতে গিয়ে বেশ কিছু আবিষ্কারেরও সূত্রপাত ঘটেছে।

প্রোটিন জীবনের জন্য অপরিহার্য। জীবনের কার্যত সমস্ত কাজ এই প্রোটিনের সহায়তায় হয়। প্রোটিন হলো এ্যামাইনো এ্যাসিডের শৃঙ্খল দিয়ে গঠিত মলিকুলের বিশাল কমপ্লেক্স। প্রোটিন কি করে তা বহুলাংশে নির্ভর করে এর অনন্য থ্রি-ডি বা ত্রিমাত্রিক কঠোমোর ওপর। প্রোটিন কোন্্ আকারে ভাঁজ নেয় সেটাই প্রোটিন ফোল্ডিং সমস্যা হিসেবে পরিচিত। গত ৫০ বছর ধরে এটাই জীববিজ্ঞানের এক মস্ত বড় চ্যালেঞ্জ হিসেবে দাঁড়িয়ে আছে। প্রোটিনের আকার তার কাজের সঙ্গে ঘনিষ্ঠভাবে যুক্ত। এই কাঠামোর পূর্বাভাস দেয়ার ক্ষমতার দ্বারাই উন্মোচিত হতে পারে প্রোটিন কি করে এবং কিভাবে কাজ করে সেই রহস্য। বিশ্বের সর্ববৃহৎ চ্যালেঞ্জগুলোর অনেকগুলোই প্রোটিন এবং সেগুলোর ভূমিকার সঙ্গে মৌলিকভাবে যুক্ত। যেমন রোগ-ব্যাধির চিকিৎসা উদ্ভাবন কিংবা শিল্পবর্জ্য ভেঙ্গে দিতে পারে এমন এনজাইম খুঁজে বের করা।

এক দশক আগে ডিপমাইল্ড চালু হওয়ার সময় বিজ্ঞানীরা আশা করেছিলেন যে, কৃত্রিম বুদ্ধিমত্তা একদিন বিজ্ঞানের মৌলিক সমস্যাবলী অনুধাবনের প্ল্যাটফর্ম হিসেবে কাজ করবে। তাদের সেই প্রত্যাশা আজ পূরণ হতে চলেছে।

আলফাফোল্ডের বিস্ময়কর নির্ভুল মডেলগুলোর বদৌলতে এখন প্রোটিনের কাঠামো রহস্য সমাধানের সুযোগ ঘটেছে। কোষের পর্দাগুলোর মধ্য দিয়ে সিগন্যাল কিভাবে পরিবাহিত হয় তা জানতে বিজ্ঞানীরা এর মাধ্যমে নতুন উদ্যমে কাজ শুরু করে দিয়েছেন। কারণ প্রোটিন কাঠামোর পূর্বাভাস সুনির্দিষ্ট কিছু রোগ-ব্যাধি পুরোপুরি অনুধাবনে অবদান রাখতে পারে। সেই প্রোটিনগুলোকে ঠিকমতো চিহ্নিত করার কাজ চলছে। এতে করে ওষুধ উদ্ভাবনে আরও সুনির্দিষ্টভাবে কাজ করা সম্ভব হবে। সম্ভাবনাময় চিকিৎসা আরও দ্রুত খুঁজে বের করার জন্য বর্তমান পরীক্ষা-নিরীক্ষার পদ্ধতির জায়গায় নতুন কৌশল উদ্ভাবিত হতে পারে।

এমন লক্ষণও দেখা গেছে যে প্রোটিন কাঠামোর পূর্বাভাস ভবিষ্যতে মহামারী মোকাবেলার উদ্যোগে সহায়ক হতে পারে। এ বছরের প্রথমদিকে বিজ্ঞানীরা সার্স-কোভ-২ ভাইরাসের বেশ কিছু প্রোটিন কাঠামোর পূর্বাভাস দিয়েছিলেন যার মধ্যে ছিল ওআরএফওএ প্রোটিন। এই প্রোটিনটির কাঠামো আগে অজানা ছিল। বিজ্ঞানীরা আরেকটি করোনাভাইরাস প্রোটিন ওআরএফ-৮-এর কাঠামোর পূর্বাভাস দিয়েছিলেন। গবেষণাকর্মীরা লক্ষণীয় দ্রুতগতিতে কাজ করার ফলে এখন ওআরএফ৩-এ এবং ওআরএফ-৮ নামক প্রোটিন দুটোর কাঠামো সম্পর্কে নিশ্চিত হওয়া গেছে।

পরিচিত রোগ-ব্যাধি অনুধাবনের কাজ ত্বরান্বিত করা ছাড়াও আলফাফোল্ড-২ এলগোরিদমের সহায়তায় আরও কোটি কোটি প্রোটিন খুঁজে বের করা, সেগুলোর ভেতরের রহস্য উন্মোচন করার সম্ভাবনা সৃষ্টি হয়েছে। এ হলো জীববিজ্ঞানের অজ্ঞাত জগতের সুবিশাল পরিমণ্ডল। এতে কয়েক দশক ধরে ল্যাবের পরীক্ষা-নিরীক্ষাই ছিল প্রোটিন কাঠামোর একটা ভাল চিত্র পাওয়ার প্রধান উপায়। ১৯৫০-এর দশক থেকে প্রোটিনের পূর্ণাঙ্গ কাঠামো নির্ণয়ের কাজ শুরু হয়। এতে ব্যবহার করা হয় এমন এক কৌশল যেখানে এক্স-রে রক্ষী কেলাসিত প্রোটিনের গায়ে ফেলে প্রোটিনের আণবিক বিন্যাস বিশ্লেষণ করে দেখা হয়। একে বলে এক্স-রে ক্রিস্টালোগ্রাফি। এর সাহায্যেই এতদিন বেশিরভাগ প্রোটিনের কাঠামো উন্মোচন করা হয়েছে। তবে বিগত দশকে সাইরো-ইএম কৌশলটা অনেক-স্ট্রাকচারাল-বায়োলজির ল্যাবগুলোতে পছন্দের হাতিয়ার হিসেবে ব্যবহৃত হয়ে আসছে। এ সব কিছুকে ছাড়িয়ে গেছে আলফাফোল্ড-২ এলগোরিদম। নির্ভুলতার দিক দিয়ে আগের কৌশলগুলো যেখানে ১০০তে ৭০ কি ৭৫ ভাগ ফল দিত সেখানে আলফাফোল্ড দিচ্ছে ৯০/৯৫ ভাগ নির্ভুল ফল। আলফাফোল্ডের পূর্বাভাস এমন একটি ব্যাকটেরিয়াল প্রোটিনের কাঠামো নির্ণয়ে সহায়ক হয়েছে যা লুপাস ল্যাব বহু বছর ধরে উন্মোচনের চেষ্টা করে আসছিল। আলফাফোল্ড-২ এলগোরিদম মাত্র আধঘণ্টার মধ্যে এই কাঠামোটি উন্মোচন করে ফেলে যে কাজটা করতে এক দশক ধরে যথাসাধ্য প্রয়াস পাওয়া গিয়েছিল। ডিপমাইন্ডের প্রধান নির্বাহী ডেমিস হাসাবিস বলেন, তার কোম্পানি আলফাফোল্ড-২ কে এমনভাবে কার্যোপযোগী করে তুলতে চাইছেন যাতে করে অন্যান্য ক্ষেত্রের বিজ্ঞানীরাও সেটাকে কাজে লাগাতে পারেন।

সূত্র : দি ইকোনমিস্ট


Discover more from শিক্ষাবার্তা ডট কম

Subscribe to get the latest posts sent to your email.