Investigating at the interface of data science and computing | MIT News

Investigating at the interface of data science and computing | MIT News

गाय ब्रेस्लर के शोध का एक दृश्य मॉडल शायद वेन आरेख जैसा कुछ दिखाई देगा। वह चार-तरफ़ा चौराहे पर काम करता है जहाँ सैद्धांतिक कंप्यूटर विज्ञान, सांख्यिकी, संभाव्यता और सूचना सिद्धांत टकराते हैं।

“इंटरफ़ेस पर हमेशा नई चीजें की जाती हैं। हमेशा पूरी तरह से नए प्रश्न पूछने के अवसर होते हैं, “एक सहयोगी प्रोफेसर ब्रेस्लर कहते हैं, जिन्होंने हाल ही में एमआईटी के इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान विभाग (ईईसीएस) में कार्यकाल अर्जित किया है।

एक सिद्धांतकार, उनका उद्देश्य डेटा में संरचना, मॉडल की जटिलता और उन मॉडलों को सीखने के लिए आवश्यक गणना की मात्रा के बीच नाजुक परस्पर क्रिया को समझना है। हाल ही में, उनका सबसे बड़ा ध्यान मौलिक घटनाओं का अनावरण करने की कोशिश कर रहा है जो सांख्यिकी समस्याओं की कम्प्यूटेशनल जटिलता को निर्धारित करने के लिए व्यापक रूप से जिम्मेदार हैं – और “स्वीट स्पॉट” ढूंढना जहां उपलब्ध डेटा और गणना संसाधन शोधकर्ताओं को प्रभावी ढंग से किसी समस्या को हल करने में सक्षम बनाते हैं।

एक जटिल सांख्यिकी समस्या को हल करने का प्रयास करते समय, डेटा और गणना के बीच अक्सर रस्साकशी होती है। पर्याप्त डेटा के बिना, एक सांख्यिकीय समस्या को हल करने के लिए आवश्यक गणना कठिन हो सकती है, या कम से कम संसाधनों की एक चौंका देने वाली मात्रा का उपभोग कर सकती है। लेकिन बस पर्याप्त डेटा प्राप्त करें और अचानक असाध्य हल करने योग्य हो जाता है; समाधान के साथ आने के लिए आवश्यक गणना की मात्रा नाटकीय रूप से कम हो जाती है।

आधुनिक सांख्यिकीय समस्याओं में से अधिकांश गणना और डेटा के बीच इस तरह के व्यापार-बंद को प्रदर्शित करते हैं, जिसमें दवा विकास से लेकर मौसम की भविष्यवाणी तक के अनुप्रयोग शामिल हैं। एक और अच्छी तरह से अध्ययन और व्यावहारिक रूप से महत्वपूर्ण उदाहरण क्रायो-इलेक्ट्रॉन माइक्रोस्कोपी है, ब्रेस्लर कहते हैं। इस तकनीक के साथ, शोधकर्ता विभिन्न अभिविन्यासों में अणुओं की छवियों को लेने के लिए एक इलेक्ट्रॉन माइक्रोस्कोप का उपयोग करते हैं। केंद्रीय चुनौती यह है कि व्युत्क्रम समस्या को कैसे हल किया जाए – शोर डेटा को देखते हुए अणु की संरचना का निर्धारण। कई सांख्यिकीय समस्याओं को इस प्रकार की व्युत्क्रम समस्याओं के रूप में तैयार किया जा सकता है।

ब्रेस्लर के काम का एक उद्देश्य वर्तमान में अध्ययन की जा रही विभिन्न सांख्यिकी समस्याओं की विस्तृत विविधता के बीच संबंधों को स्पष्ट करना है। सपना सांख्यिकीय समस्याओं को तुल्यता वर्गों में वर्गीकृत करना है, जैसा कि कम्प्यूटेशनल जटिलता के क्षेत्र में अन्य प्रकार की कम्प्यूटेशनल समस्याओं के लिए किया गया है। वे कहते हैं कि इस तरह के रिश्तों को दिखाने का मतलब है कि, प्रत्येक समस्या को अलगाव में समझने की कोशिश करने के बजाय, शोधकर्ता अपनी समझ को एक अच्छी तरह से अध्ययन की गई समस्या से खराब समझ में स्थानांतरित कर सकते हैं, वे कहते हैं।

सैद्धांतिक दृष्टिकोण अपनाना

ब्रेस्लर के लिए, विभिन्न बुनियादी घटनाओं को सैद्धांतिक रूप से समझने की इच्छा ने उन्हें शिक्षा के क्षेत्र में एक पथ का अनुसरण करने के लिए प्रेरित किया।

उनके माता-पिता दोनों ने प्रोफेसरों के रूप में काम किया और दिखाया कि शिक्षा को पूरा करना कितना अच्छा हो सकता है, वे कहते हैं। इंजीनियरिंग के सैद्धांतिक पक्ष से उनका सबसे पहला परिचय उनके पिता से हुआ, जो एक इलेक्ट्रिकल इंजीनियर हैं और सिग्नल प्रोसेसिंग का अध्ययन करने वाले सिद्धांतकार हैं। ब्रेस्लर कम उम्र से ही अपने काम से प्रेरित थे। अर्बाना-शैंपेन में इलिनोइस विश्वविद्यालय में स्नातक के रूप में, उन्होंने भौतिकी, गणित और कंप्यूटर विज्ञान पाठ्यक्रमों के बीच बाउंस किया। लेकिन विषय कोई भी हो, उन्होंने सैद्धांतिक दृष्टिकोण की ओर रुख किया।

बर्कले में कैलिफोर्निया विश्वविद्यालय में स्नातक स्कूल में, ब्रेस्लर ने संभाव्यता, सैद्धांतिक कंप्यूटर विज्ञान और गणित में फैले विभिन्न प्रकार के विषयों में काम करने का अवसर प्राप्त किया। उनका ड्राइविंग प्रेरक नई चीजें सीखने का प्यार था।

“नए प्रश्नों के साथ कई क्षेत्रों के इंटरफेस पर काम करते हुए, ऐसा महसूस होता है कि अगर किसी को उन सवालों के जवाब देने के लिए सही उपकरण खोजने का कोई मौका मिलता है तो जितना संभव हो उतना बेहतर सीखना चाहिए,” वे कहते हैं।

उस जिज्ञासा ने उन्हें 2013 में सूचना और निर्णय प्रणाली (एलआईडीएस) के लिए प्रयोगशाला में पोस्टडॉक के लिए एमआईटी में ले जाया, और फिर वे दो साल बाद ईईसीएस में सहायक प्रोफेसर, एलआईडीएस के सदस्य और एक मुख्य संकाय सदस्य के रूप में संकाय में शामिल हो गए। इंस्टिट्यूट फॉर डेटा, सिस्टम्स एंड सोसाइटी (IDSS)। उन्हें 2019 में एसोसिएट प्रोफेसर नामित किया गया था।

ब्रेस्लर का कहना है कि वह एमआईटी में बौद्धिक माहौल के साथ-साथ साहसिक शोध quests शुरू करने और अध्ययन के नए क्षेत्रों में प्रगति करने की कोशिश करने के लिए सहायक वातावरण के लिए तैयार थे।

सहयोग के अवसर

“जिस बात ने मुझे वास्तव में प्रभावित किया वह यह था कि एमआईटी कितना जीवंत और ऊर्जावान और सहयोगी है। मेरे पास 20 से अधिक लोगों की यह मानसिक सूची है, जिन्हें मैं हर एक सप्ताह में दोपहर का भोजन करना और अनुसंधान में सहयोग करना पसंद करूंगा। तो सिर्फ सरासर संख्या के आधार पर, एमआईटी में शामिल होना एक स्पष्ट जीत थी,” वे कहते हैं।

उन्हें विशेष रूप से अपने छात्रों के साथ सहयोग करने में मज़ा आता है, जो उन्हें लगातार नई चीजें सिखाते हैं और रोमांचक शोध परियोजनाओं को चलाने वाले गहरे प्रश्न पूछते हैं। ऐसे ही एक छात्र, मैथ्यू ब्रेनन, जो ब्रेस्लर के सबसे करीबी सहयोगियों में से एक थे, का जनवरी, 2021 में दुखद और अप्रत्याशित रूप से निधन हो गया।

ब्रेनन की मौत का सदमा ब्रेस्लर के लिए अभी भी कच्चा है, और इसने कुछ समय के लिए उनके शोध को पटरी से उतार दिया।

“अपनी विलक्षण क्षमताओं और रचनात्मकता से परे, उनके पास मेरे एक विचार को सुनने की यह अद्भुत क्षमता थी जो लगभग पूरी तरह से गलत था, इसमें से एक उपयोगी टुकड़ा निकालें, और फिर गेंद को वापस पास करें,” वे कहते हैं। “हम काम में जो हासिल करना चाहते थे, उसके लिए हमारे पास वही दृष्टिकोण था, और हमें एक निश्चित कहानी बताने की कोशिश करने के लिए प्रेरित किया गया था। उस समय, लगभग कोई भी इस विशेष कार्य का अनुसरण नहीं कर रहा था, और यह एक तरह से अकेला था। लेकिन उसने मुझ पर भरोसा किया, और हमने एक-दूसरे को प्रोत्साहित किया कि जब चीजें धूमिल हों तो इसे बनाए रखें।”

दृढ़ता के वे पाठ ब्रेस्लर को ईंधन देते हैं क्योंकि वह और उनके छात्र ऐसे प्रश्नों की खोज जारी रखते हैं, जिनका उत्तर उनके स्वभाव से कठिन होता है।

एक दशक से अधिक समय से उन्होंने एक क्षेत्र में काम किया है जिसमें डेटा से ग्राफिकल मॉडल सीखना शामिल है। कुछ प्रकार के डेटा के मॉडल, जैसे कि समय-श्रृंखला डेटा जिसमें तापमान रीडिंग शामिल हैं, अक्सर उन डोमेन विशेषज्ञों द्वारा निर्मित किए जाते हैं जिनके पास प्रासंगिक ज्ञान होता है और वे एक उचित मॉडल का निर्माण कर सकते हैं, वे बताते हैं।

लेकिन सामाजिक नेटवर्क या जैविक डेटा जैसे जटिल निर्भरता वाले कई प्रकार के डेटा के लिए, यह बिल्कुल भी स्पष्ट नहीं है कि एक मॉडल को कौन सी संरचना लेनी चाहिए। ब्रेस्लर का काम डेटा से एक संरचित मॉडल का अनुमान लगाना चाहता है, जिसे बाद में डाउनस्ट्रीम अनुप्रयोगों के लिए इस्तेमाल किया जा सकता है जैसे कि सिफारिशें करना या मौसम की बेहतर भविष्यवाणी करना।

वे कहते हैं कि सैद्धांतिक विश्लेषण के लिए एक उपयोगी खिलौना मॉडल निर्दिष्ट करके अच्छे मॉडल की पहचान करने का मूल प्रश्न, चाहे वह जटिल सेटिंग में हो या विश्लेषणात्मक रूप से, अमूर्त कार्य को इंजीनियरिंग अभ्यास से जोड़ता है, वे कहते हैं।

“सामान्य तौर पर, मॉडलिंग एक कला है। वास्तविक जीवन जटिल है और यदि आप कुछ सुपर-जटिल मॉडल लिखते हैं जो किसी समस्या की हर विशेषता को पकड़ने की कोशिश करता है, तो यह बर्बाद हो जाता है, “ब्रेस्लर कहते हैं। “आपको समस्या के बारे में सोचना होगा और मॉडल की जाने वाली समस्या की सही विशेषताओं की पहचान करने के लिए चीजों के व्यावहारिक पक्ष को कुछ स्तर पर समझना होगा, ताकि आप वास्तव में इसे हल करने की उम्मीद कर सकें और अभ्यास में क्या करना चाहिए, इस बारे में अंतर्दृष्टि प्राप्त कर सकें। “

लैब के बाहर, ब्रेस्लर अक्सर खुद को बहुत अलग तरह की समस्याओं को हल करते हुए पाता है। वह एक शौकीन चावला पर्वतारोही है और अपना अधिकांश खाली समय पूरे न्यू इंग्लैंड में बोल्डिंग में बिताता है।

“मुझे वास्तव में इसे प्यार है। बाहर निकलने और पूरी तरह से अलग दुनिया में चूसा जाने का यह एक अच्छा बहाना है। हालांकि इसमें समस्या समाधान शामिल है, और दार्शनिक स्तर पर समानताएं हैं, यह बैठकर गणित करने के लिए पूरी तरह से ऑर्थोगोनल है, “वे कहते हैं।

.