एआयकडे जाणीवपूर्वक दृष्टीकोन घेतल्याने पक्षपाती डेटा सेट्स कमी होतात

पक्षपाती डेटासेट आणि नैतिक AI

एआय-चालित उपायांना प्रभावी होण्यासाठी डेटा सेट आवश्यक आहेत. आणि त्या डेटा सेट्सची निर्मिती पद्धतशीर पातळीवर अंतर्भूत पूर्वाग्रह समस्येने परिपूर्ण आहे. सर्व लोक पक्षपाती (जागरूक आणि बेशुद्ध दोन्ही) ग्रस्त आहेत. पूर्वाग्रह कितीही प्रकार घेऊ शकतात: भौगोलिक, भाषिक, सामाजिक-आर्थिक, लैंगिकतावादी आणि वंशवादी. आणि ते पद्धतशीर पूर्वाग्रह डेटामध्ये तयार केले जातात, ज्यामुळे एआय उत्पादने कायम राहू शकतात आणि पूर्वाग्रह वाढवू शकतात. डेटा सेटमध्ये होणारा पूर्वाग्रह कमी करण्यासाठी संस्थांना एक सजग दृष्टिकोन आवश्यक आहे.

पूर्वाग्रह समस्या स्पष्ट करणारी उदाहरणे

या डेटा सेट पूर्वाग्रहाचे एक उल्लेखनीय उदाहरण ज्याने त्या वेळी बरीच नकारात्मक प्रेस मिळवली ते म्हणजे एक रेझ्युमे वाचन समाधान ज्याने महिलांपेक्षा पुरुष उमेदवारांना पसंती दिली. याचे कारण असे की भरती साधनाचे डेटा सेट गेल्या दशकापासून रेझ्युमे वापरून विकसित केले गेले होते जेव्हा बहुतेक अर्जदार पुरुष होते. डेटा पक्षपाती होता आणि परिणाम त्या पक्षपातीपणाचे प्रतिबिंबित करतात. 

आणखी एक व्यापकपणे नोंदवलेले उदाहरण: वार्षिक Google I/O डेव्हलपर कॉन्फरन्समध्ये, Google ने AI- समर्थित त्वचाविज्ञान सहाय्य साधनाचे पूर्वावलोकन शेअर केले जे लोकांना त्यांच्या त्वचा, केस आणि नखांशी संबंधित समस्या काय आहे हे समजून घेण्यास मदत करते. त्वचाविज्ञान सहाय्यक अधोरेखित करतो की AI आरोग्यसेवेला मदत करण्यासाठी कसे विकसित होत आहे — परंतु हे साधन रंगीबेरंगी लोकांसाठी पुरेसे नाही या टीकेच्या पार्श्वभूमीवर AI मध्ये रेंगाळण्याची पूर्वाग्रहाची क्षमता देखील अधोरेखित केली.

जेव्हा गूगलने या टूलची घोषणा केली, तेव्हा कंपनीने नोंद केली:

आम्ही प्रत्येकासाठी तयार करत आहोत हे सुनिश्चित करण्यासाठी, आमचे मॉडेल वय, लिंग, वंश आणि त्वचेचे प्रकार यांसारख्या घटकांचा विचार करते — फिकट त्वचेपासून ते तपकिरी त्वचेपर्यंत जी क्वचितच जळते.

Google, सामान्य त्वचेच्या परिस्थितीची उत्तरे शोधण्यात मदत करण्यासाठी AI वापरत आहे

पण व्हाइसमधील एका लेखात म्हटले आहे की Google सर्वसमावेशक डेटा सेट वापरण्यात अयशस्वी झाले:

हे कार्य पूर्ण करण्यासाठी, संशोधकांनी दोन राज्यांमधील 64,837 रुग्णांच्या 12,399 प्रतिमांचा प्रशिक्षण डेटासेट वापरला. परंतु चित्रित केलेल्या हजारो त्वचेच्या स्थितींपैकी, फक्त 3.5 टक्के फिट्झपॅट्रिक त्वचेचे प्रकार V आणि VI असलेल्या रूग्णांमधून आले आहेत - जे अनुक्रमे तपकिरी त्वचा आणि गडद तपकिरी किंवा काळी त्वचा दर्शवतात. अभ्यासानुसार, 90 टक्के डेटाबेस गोरा त्वचा, गडद पांढरी त्वचा किंवा हलकी तपकिरी त्वचा असलेल्या लोकांचा बनलेला होता. पक्षपाती नमुन्याच्या परिणामस्वरूप, त्वचारोग तज्ञ म्हणतात की अॅप पांढरे नसलेल्या लोकांना जास्त किंवा कमी निदान करू शकते.

व्हाइस, Google चे नवीन त्वचाविज्ञान अॅप गडद त्वचेच्या लोकांसाठी डिझाइन केलेले नाही

गूगलने उत्तर दिले की ते औपचारिकपणे रिलीज करण्यापूर्वी ते टूल रिफाइन करेल:

आमचे AI-शक्तीवर चालणारे त्वचाविज्ञान सहाय्य साधन हे तीन वर्षांपेक्षा जास्त संशोधनाचा कळस आहे. नेचर मेडिसिनमध्ये आमचे कार्य वैशिष्ट्यीकृत असल्याने, आम्ही आमच्या तंत्रज्ञानाचा विकास आणि परिष्करण करणे सुरू ठेवले आहे ज्यात अतिरिक्त डेटासेटचा समावेश आहे ज्यामध्ये हजारो लोकांनी दान केलेला डेटा आणि लाखो अधिक क्युरेटेड त्वचा चिंता प्रतिमा समाविष्ट आहेत.

Google, सामान्य त्वचेच्या परिस्थितीची उत्तरे शोधण्यात मदत करण्यासाठी AI वापरत आहे

एआय आणि मशीन लर्निंग प्रोग्राम या पूर्वाग्रहांना दुरुस्त करू शकतील अशी आम्ही आशा करू शकतो, वास्तविकता कायम आहे: ते फक्त इतकेच आहेत स्मार्ट कारण त्यांचा डेटा सेट स्वच्छ आहे. जुन्या प्रोग्रामिंग म्हणीच्या अपडेटमध्ये कचरा आत कचरा बाहेर, एआय सोल्यूशन्स फक्त मिळवण्यापासून त्यांच्या डेटा सेटची गुणवत्ता जितकी मजबूत आहेत. प्रोग्रामरकडून सुधारणा न करता, या डेटा सेट्समध्ये स्वतःचे निराकरण करण्याचा पार्श्वभूमी अनुभव नसतो - कारण त्यांच्याकडे संदर्भाची दुसरी चौकट नसते.

जबाबदारीने डेटा संच तयार करणे हा सर्वांचा गाभा आहे नैतिक कृत्रिम बुद्धिमत्ता. आणि लोक उपायांच्या केंद्रस्थानी आहेत. 

माइंडफुल एआय हे एथिकल एआय आहे

पूर्वाग्रह शून्यात होत नाही. अनैतिक किंवा पक्षपाती डेटा संच विकासाच्या टप्प्यात चुकीचा दृष्टीकोन घेतल्याने येतात. पक्षपाती त्रुटींचा सामना करण्याचा मार्ग म्हणजे एक जबाबदार, मानव-केंद्रित, दृष्टिकोन स्वीकारणे ज्याला उद्योगातील बरेच लोक माइंडफुल एआय म्हणत आहेत. माइंडफुल एआयमध्ये तीन महत्त्वपूर्ण घटक आहेत:

1. माइंडफुल एआय मानव-केंद्रित आहे

एआय प्रकल्पाच्या प्रारंभापासून, नियोजनाच्या टप्प्यात, लोकांच्या गरजा प्रत्येक निर्णयाच्या केंद्रस्थानी असणे आवश्यक आहे. आणि याचा अर्थ सर्व लोक - फक्त उपसंच नाही. म्हणूनच विकासकांना AI ऍप्लिकेशन्सना सर्वसमावेशक आणि पक्षपातमुक्त होण्यासाठी प्रशिक्षण देण्यासाठी जागतिक स्तरावर आधारित लोकांच्या विविध टीमवर अवलंबून राहण्याची आवश्यकता आहे.

जागतिक, वैविध्यपूर्ण संघाकडून डेटा सेट क्राउडसोर्सिंग हे सुनिश्चित करते की पूर्वाग्रह ओळखले जातात आणि लवकर फिल्टर केले जातात. भिन्न जाती, वयोगट, लिंग, शैक्षणिक स्तर, सामाजिक-आर्थिक पार्श्वभूमी आणि स्थाने अधिक सहजतेने डेटा सेट शोधू शकतात जे एका मूल्यांच्या संचाला दुसर्‍यापेक्षा अनुकूल करतात, अशा प्रकारे अनपेक्षित पूर्वाग्रह दूर करतात.

व्हॉईस प्लिकेशनवर एक नजर टाका. जागरूक AI दृष्टिकोन लागू करताना आणि जागतिक प्रतिभा तलावाच्या सामर्थ्याचा लाभ घेताना, डेव्हलपर डेटा सेट्समध्ये विविध बोली आणि अॅक्सेंट सारख्या भाषिक घटकांसाठी जबाबदार असू शकतात.

सुरुवातीपासून मानव-केंद्रित डिझाइन फ्रेमवर्क स्थापित करणे महत्वाचे आहे. व्युत्पन्न केलेला, क्युरेट केलेला आणि लेबल केलेला डेटा अंतिम वापरकर्त्यांच्या अपेक्षा पूर्ण करतो याची खात्री करण्यासाठी हे खूप पुढे जाते. परंतु संपूर्ण उत्पादन विकास जीवनचक्रात मानवांना लूपमध्ये ठेवणे देखील महत्त्वाचे आहे. 

लूपमधील मानव प्रत्येक विशिष्ट प्रेक्षकांसाठी एक चांगला AI अनुभव तयार करण्यात मशीनला मदत करू शकतात. Pactera EDGE वर, आमच्या AI डेटा प्रकल्प कार्यसंघ, जागतिक स्तरावर स्थित, विविध संस्कृती आणि संदर्भ विश्वसनीय AI प्रशिक्षण डेटाच्या संकलन आणि क्युरेशनवर कसा प्रभाव टाकू शकतात हे समजून घेतात. एआय-आधारित सोल्यूशन थेट होण्यापूर्वी त्यांच्याकडे समस्यांना ध्वजांकित करण्यासाठी, त्यांचे निरीक्षण करण्यासाठी आणि त्यांचे निराकरण करण्यासाठी आवश्यक साधने आहेत.

ह्युमन-इन-द-लूप AI हा एक प्रकल्प "सुरक्षा नेट" आहे जो लोकांच्या सामर्थ्याचा - आणि त्यांची विविध पार्श्वभूमी मशीनच्या वेगवान संगणकीय शक्तीसह एकत्रित करतो. या मानवी आणि एआय सहकार्य कार्यक्रमांच्या प्रारंभापासून स्थापित करणे आवश्यक आहे जेणेकरून पक्षपाती डेटा प्रकल्पात पाया तयार करू नये. 

2. माइंडफुल एआय जबाबदार आहे

जबाबदार असणे हे हे सुनिश्चित करणे आहे की एआय प्रणाली पक्षपाती नसतात आणि ते नैतिकतेवर आधारित असतात. डेटा कसा, का आणि कोठे तयार केला जातो, एआय सिस्टीमद्वारे त्याचे संश्लेषण कसे केले जाते आणि निर्णय घेण्यामध्ये त्याचा उपयोग कसा होतो, नैतिक परिणाम असू शकतात अशा निर्णयांबद्दल हे लक्षात ठेवण्याबद्दल आहे. व्यवसायासाठी असे करण्याचा एक मार्ग म्हणजे कमी प्रतिनिधित्व असलेल्या समुदायांसह अधिक समावेशक आणि कमी पक्षपाती होण्यासाठी कार्य करणे. डेटा एनोटेशनच्या क्षेत्रात, नवीन संशोधन हे हायलाइट करत आहे की मल्टी-एनोटेटर मल्टी-टास्क मॉडेल जे प्रत्येक भाष्यकाराच्या लेबलांना स्वतंत्र सबटास्क म्हणून हाताळते ते सामान्य ग्राउंड ट्रूथ पद्धतींमध्ये अंतर्निहित संभाव्य समस्या कमी करण्यास मदत करू शकते जेथे भाष्यकार मतभेद कमी-प्रतिनिधीमुळे असू शकतात आणि एका मूळ सत्याकडे भाष्यांच्या एकत्रीकरणात दुर्लक्ष केले जाऊ शकते. 

3. विश्वासार्ह

एआय मॉडेल कसे प्रशिक्षित केले जाते, ते कसे कार्य करते आणि ते परिणामांची शिफारस का करतात याबद्दल पारदर्शक आणि स्पष्ट करण्यायोग्य व्यवसायातून विश्वासार्हता येते. एखाद्या व्यवसायाला AI लोकलायझेशनसह कौशल्याची आवश्यकता असते जेणेकरून त्याच्या क्लायंटला त्यांचे AI अनुप्रयोग अधिक समावेशक आणि वैयक्तिकृत करणे शक्य होईल, स्थानिक भाषेतील गंभीर बारकावे आणि वापरकर्ता अनुभवांचा आदर करून जे एका देशापासून दुसऱ्या देशात AI सोल्यूशनची विश्वासार्हता बनवू किंवा खंडित करू शकतात. . उदाहरणार्थ, व्यवसायाने वैयक्तिक आणि स्थानिक संदर्भांसाठी त्याचे अनुप्रयोग डिझाइन केले पाहिजेत, ज्यामध्ये भाषा, बोली आणि ध्वनी-आधारित अनुप्रयोगांमध्ये अॅक्सेंटचा समावेश आहे. अशाप्रकारे, एक अॅप इंग्रजीपासून ते कमी-प्रतिनिधी भाषांपर्यंत प्रत्येक भाषेत समान पातळीवरील आवाजाचा अनुभव आणतो.

निष्पक्षता आणि विविधता

शेवटी, जागरूक AI हे सुनिश्चित करते की निराकरणे निष्पक्ष आणि वैविध्यपूर्ण डेटा सेटवर तयार केली जातात जिथे सोल्यूशन बाजारात येण्यापूर्वी विशिष्ट परिणामांचे परिणाम आणि परिणामांचे परीक्षण आणि मूल्यमापन केले जाते. सजग राहून आणि सोल्यूशनच्या विकासाच्या प्रत्येक भागामध्ये मानवांचा समावेश करून, आम्ही AI मॉडेल्स स्वच्छ, कमीत कमी पक्षपाती आणि शक्य तितक्या नैतिक राहतील याची खात्री करण्यात मदत करतो.

तुला काय वाटत?

ही साइट स्पॅम कमी करण्यासाठी अकिस्मेट वापरते आपल्या टिप्पणी डेटावर प्रक्रिया कशी केली जाते ते जाणून घ्या.