आंतरराष्ट्रीयकरण, स्थानिकीकरण, एन्कोडिंग, आइसलँड आणि जपानी मांजरीच्या फोटो वेबसाइटचे भाषांतर

आंतरराष्ट्रीयकरण भाषांतर

आंतरराष्ट्रीयकरणजेव्हा आंतरराष्ट्रीयकरण, स्थानिकरण आणि वेब अनुप्रयोगांमध्ये एन्कोडिंगचा विचार केला जातो तेव्हा तेथे बरेच माहिती असते. प्रत्येक वेब अनुप्रयोगासाठी काय प्रदान करते याबद्दल बरेच गैरसमज देखील आहेत. हे माझे घ्या…

जेव्हा एखादा वेब ब्राउझर वेब सर्व्हरशी कनेक्शन बनवितो, तेव्हा तो थोडासा बदल करून अतिरिक्त विनंत्या करतो, येथे एक उदाहरणः

GET / HTTP / 1.1
होस्टः www.dknewmedia.com
वापरकर्ता-एजंट: मोझीला / 5.0 (मॅकिंटोश; यू; इंटेल मॅक ओएस एक्स; एन-यूएस; आरव्ही: 1.8.1.3) गेको / 20070309 फायरफॉक्स / 2.0.0.3
स्वीकारा: HTTP स्वीकार = मजकूर / एक्सएमएल, अनुप्रयोग / एक्सएमएल, अनुप्रयोग / एक्सएचटीएमएल + एक्सएमएल, मजकूर / एचटीएमएल; क्यू = 0.9, मजकूर / साधा; क्यू = 0.8, प्रतिमा / पीएनजी, * / *; क्यू = 0.5
स्वीकृती-भाषाः एन-यूएस, एन; क्यू = 0.5
स्वीकारा-एन्कोडिंगः जीझिप, डिफलेट
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

आंतरराष्ट्रीयकरण

आंतरराष्ट्रीयकरण ही बर्‍याच गोष्टींचे मिश्रण आहे:

 1. स्थानिकीकरण: अभ्यागत कोणती भाषा आणि स्थान भेट देत आहेत हे ओळखण्याची क्षमता. हे HTTP विनंत्यांद्वारे केले जाते जेथे अभ्यागतांना लोकॅलद्वारे ओळखले जाते. माझ्या बाबतीत, ते एन-यूएस आहे. “इं” इंग्रजी आहे आणि “यूएस” युनायटेड स्टेट्स आहे. माझ्या ऑपरेटिंग सिस्टममध्ये ही एक सेटिंग आहे.
 2. वेळ क्षेत्र: टाइम झोनसाठी समायोजित करण्याची क्षमता. हे सहसा आपल्या सर्व्हरला ग्रीनविच मीन टाइम (जीएमटी) वर सेट करून आणि नंतर वापरकर्त्यांना जीएमटीमधून त्यांचे स्थानिक ऑफसेट सेट करण्याची परवानगी देऊन पूर्ण केले जाते.
 3. कॅरेक्टर एन्कोडिंग: भाषेचे वर्ण योग्यरित्या सेट करण्याची ही क्षमता आहे. हे लोकलायझेशनपेक्षा भिन्न आहे कारण स्थानिकीकरण संगणकाची भाषा आणि क्षेत्र ज्याकडून विनंती करीत आहे ते मला सांगू शकते, परंतु ती कोणती भाषा मला सांगणार नाही वाचक विनंती करीत आहे… हे वाचकांवर अवलंबून आहे!

जेव्हा ब्राउझरने विनंती केली तेव्हा माझ्या HTTP शीर्षलेखातील सूचना, सर्व्हरला सांगितले की ते माझ्या लोकॅलची विनंती करीत आहे (स्वीकार करा भाषा: एन-यूएस); तथापि, सर्व्हरला कॅरॅक्टर सेटची विनंती काय आहे हे देखील सांगणे आवश्यक आहे (एक्सेप्ट-चारसेट: एक्सेप्ट-चारसेट: आयएसओ -8859-1, यूटीएफ -8; क्यू = 0.7, *; क्यू = 0.7) आयएसओ -8859-1 आणि यूटीएफ -8 हे दोन्ही परवानगीचे पात्र संच आहेत.

स्थानिकीकरण

या विलक्षण मिश्रित जगात स्थानिकीकरण यापुढे कधीही भाषेचे हुकूम देत नाही. जरी मी एन-यूएसमध्ये आहे, तरीही मी भिन्न कॅरेक्टर सेट वापरुन भिन्न भाषा वाचू शकतो… मी वापरतो तेव्हा असेच होते गूगल हिंदी (मी खरोखर Google हिंदी वापरत नाही). माझी लोकॅल आणि कॅरॅक्टर सेटसाठीची विनंती मी जेव्हा विनंती केली त्याचप्रमाणेच आहे गूगल इंग्रजी पृष्ठ, परंतु मी प्रत्यक्षात एक पृष्ठ दिले आहे जे मी वाचू शकत नाही कारण माझ्याकडे वर्ण संच नाही. हे सर्व येत आहे ???????????? तथापि, मी ते वर्ण फायरफॉक्स (फायरफॉक्स> प्राधान्ये> प्रगत> भाषा) मध्ये लोड करू शकतो:

फायरफॉक्स लोड भाषा

मी ती भाषा लोड करीत असल्यास, नंतर मी माझ्या मूळ वर्ण सेटमध्ये पृष्ठाची विनंती करु आणि माझ्या संगणकावर ते प्रदर्शित करू शकलो तरीही माझे डीफॉल्ट लोकेशन एन-यूएस आहे!

तर… मी एक हिंदी विद्यार्थी असल्यास पर्ड्यू येथे इंग्रजी शिकत आहे आणि मार्गे कनेक्ट केलेला आहे व्हीपीएन ऑस्ट्रेलियात सुट्टीवर असलेल्या शाळेच्या सर्व्हरवर… अशा 3 वेगवेगळ्या सेटिंग्ज आहेत ज्यांचा ख truly्या अर्थाने आंतरराष्ट्रीयकरण करण्यासाठी अर्ज करण्याची आवश्यकता आहे - आणि काहीही नाही इतर अवलंबून

माझे स्थान एन-यूएस म्हणून समोर येईल, परंतु माझा टाइमझोन ऑस्ट्रेलिया आहे, परंतु वेबसाइटवरून मी विनंती करत असलेली भाषा हिंदी असू शकते. मी अर्ज करण्यासाठी माझा अर्ज करत असल्यास धारणा माझ्या संगणकाच्या लोकॅलवर आधारित, मी पूर्णपणे चुकीचे आहे - ईस्टर्न टाइमझोनमध्ये त्या व्यक्तीला इंग्रजी फीडिंग करतो. तद्वतच, मी माझा अनुप्रयोग ऑफर करण्यासाठी प्रोग्राम करेन दोन्ही भाषा आणि टाइमझोन सेटिंग्ज… परंतु मी त्या लोकॅलवर आधारित गृहीत धरत नाही.

आईसलँड - अंतिम उदाहरण

आम्ही जेथे आहोत तेथे युनायटेड स्टेट्समध्ये बहुभाषिक आणि बहु-भाषेच्या आव्हानांविषयी आम्ही दुर्लक्ष करतो सर्व इंग्रजी बोला [उपहासात्मक निहित]. आईसलँडसारख्या काही देशांमध्ये मूळ भाषा आइसलँडिक असली तरी अविश्वसनीय आइसलँडिक लोक 3 भाषा शिकत वाढतात! आईसलँड हा युरोप आणि उत्तर अमेरिकेच्या मध्यभागी असलेला देश असल्याने त्यांच्या कंपन्या त्यांच्या डेस्कटॉपवरून एकाधिक खंड, भाषा, भाषांचे बोलीभाषा आणि एकाधिक टाईमझोनवर काम करतात!

बर्‍याच आइसलँडिक वेबसाइट्स यूएस इंग्रजी, यूके इंग्रजी, आइसलँडिक, स्पॅनिश, स्पॅनिश, फ्रेंच आणि जर्मनमध्ये तयार केल्या आहेत! ते तयार करणे किती आव्हानात्मक असेल याची कल्पना करा आईसलँडेरचा वेबसाइट अनुप्रयोग आणि तिकीट प्रणाली ... व्वा!

अस्वीकरणः आईसलँडियरच्या चांगल्या लोकांसोबत काम करण्याचा मला पूर्णपणे आनंद झाला आणि मी सांगू शकतो की ते काम करणारे सर्वात प्रतिभावान आणि मैत्रीपूर्ण व्यावसायिक आहेत ज्यात मला काम करायला आवडत आहे. हे फक्त एक आश्चर्यकारक देश आणि लोक आहे! भेट द्या ... आईसलँडॅर घ्या आणि नक्की भेट द्या Blue Lagoon!

एन्कोडिंग विरूद्ध भाषा

एकाच भाषेमध्ये भिन्न वर्ण एन्कोडिंग्ज देखील आहेत जी एकमेकांशी चांगले खेळत नाहीत! उदाहरणः शिफ्ट-जेआयएस मध्ये लिहिलेले एक जपानी ईमेल जापानी-जेपी वर सेट केलेल्या लोकॅलायझेशनसह जपानी व्यक्तीच्या संगणकावर अवाचनीय रेंडर करू शकते कारण त्यांचा मेल सर्व्हर केवळ EUC-JP ओळखतो. तद्वतच, ग्राहक एन्कोडिंग आणि कोणती भाषा ग्राहकांना विनंती करीत आहे त्यानुसार सुसंगत आहे याची खात्री करुन - कोणत्या एन्कोडिंगला तसेच कोणती भाषा त्यांना पाहिजे ते सेट करण्यास सक्षम असावे.

जर मला जपानी भाषा वाचायचं असेल तर ती भाषा योग्यप्रदर्शित करण्यासाठी एन्कोडिंगसाठी मला माझी भाषा आणि Shift-JIS या दोघांची निवड करावी लागेल. मिश्रणात जोडण्यासाठी येथे आणखी एक गोंधळ आहे ... काही एन्कोडिंग प्रकार बर्‍याच भाषांना समर्थन देतात. युनिकोड / यूटीएफ 8 डझनभर लोकांना समर्थन देते. उलट देखील खरे आहे. काही भाषा बर्‍याच एन्कोडिंग प्रकारांमध्ये वाचल्या जाऊ शकतात. जर त्याचा अर्थ नसेल तर ... मी दिलगीर आहोत, ही एक अतिशय गुंतागुंतीची समस्या आहे.

एखाद्या दिवशी माझा विश्वास आहे (आशा आहे) हे सर्व बदलेल. मला वाटते की लोकॅलायझेशन कोडच्या मूळ डिझाइनर्सना अशी आशा होती की भाषा-देशी कॉम्बो आवश्यक असलेल्या सर्व गोष्टींमध्ये असेल ... परंतु आम्ही बरेच अधिक परिष्कृत झालो आहोत. लक्षात ठेवा यापैकी बरेच काही इंटरनेट अस्तित्त्वात येण्यापूर्वी विकसित केले गेले होते. च्या आगमनाने जीआयएस, कदाचित एखादी व्यक्ती त्यांचे एन्कोडिंग निवडू शकेल आणि जीआयएस टाईमझोन आणि स्थानिक माहिती हाताळू शकेल.

आंतरराष्ट्रीयकरण

आंतरराष्ट्रीयकरण आधारावर परत. आपण आंतरराष्ट्रीयकरण अनुप्रयोग प्रदान करू इच्छित असल्यास, आपल्याला हे करणे आवश्यक आहे:

 1. एकाधिक एन्कोडिंग प्रकार, भाषा आणि त्या अनुवाद प्रदर्शित करण्यासाठी भाषांतर फायली असण्याचे समर्थन करा.
 2. क्लायंटला त्यांची भाषा आणि कदाचित आवश्यक असल्यास त्यांचा एन्कोडिंग प्रकार सेट करण्याची परवानगी द्या.
 3. जीएमटीच्या तुलनेत वापरकर्त्यांना त्यांच्या टाईमझोनचा संदर्भ देण्याची परवानगी देऊन वेळ क्षेत्रांचे समर्थन करा.
 4. सावधगिरीने लोकलायझेशन कोडचा उपयोग करा… आपला वापरकर्ता प्रत्यक्षात काय विनंती करीत आहे किंवा ते काय वाचू शकतात हे ते अचूकपणे दर्शवित नाहीत.

भाषांतर

मशीन भाषांतर अद्याप सुरुवातीच्या काळात आहे. तेथे बर्‍याच वेबसाइट्स आहेत (आणि वर्डप्रेस प्लगइन) आपल्या साइटचे मशीन भाषांतर ऑफर करते. असे करण्याचा मोह होऊ नका… अशी दोन कारणे आहेतः

 1. मशीन भाषांतर कार्य करत असल्यास, आपल्या साइटची तपासणी करीत असलेल्या वापरकर्त्याकडे आधीपासूनच कार्य करण्यासाठी अनुवादक असेल.
 2. मशीन भाषांतर निराशेचा उदगार.

माझ्यावर विश्वास ठेवू नका? आपल्यासाठी येथे एक जपानी अनुवाद आहे:
पासून पेस्ट केले मसात्सु फाईल - मांजरींच्या टन टन चित्रे असलेले एक मित्र:

जपानी ब्लॉग एंट्री

????????????
- 00:29:35 मसात्सु द्वारे

??????????????????????????????
????????????????????????????

???????????? (?)?

???????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?????????????????????????????????????????????????

??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

??????????????????

???????????????
????????????
????????????

??????????????????????????????????????????????????????????????????????????????????????????????

???????????????????????????????

????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?????????????????????????????????????????????????
??????????? अग ???????????????

???????????????????????????????????????????????????????????????????????????????????????????????????????????????????

मशीन भाषांतर:

?? हान ?????
-00: 29: 35 मसात्सू द्वारे

कालच्या “अ / पशूची मुठ्ठी चपळ” वर दिसणार्‍या / हत्तीच्या मुट्ठी संतचे नाव? रेंजर ”“ ?? हान ???? ” एक / रेडिओ अभिनेता Yutaka Mizushima सह….

? (?) जे कटलफिश सहजतेने करते.

कारण अगदी मुट्ठी संत, मास्टर रेडिओ अभिनेता ????? एक / मांजरीची नगाई इचिरो ची चिनी रानी आहे = ड्रॅगन बॉल / च्या स्टाफचा ?? रेंजर अशा लोकांसारखे दिसतात जे विनोदी टिप्पणी सहजपणे ओळखतात.

?????? (घाम) जो मी या वर्षी पूर्णपणे विसरत होतो, दरवर्षी नेहमीच्या सरावाचे “सुपर फ्लीटच्या नावाचे रहस्य” ?,

?????? मी यावर्षी निर्दोषपणे लिहिल्यास,

??????? मंदिर ??? (कसे?)? हेडलँड कुलियन (?? कट नाही) फुकमी ?? (? किंवा सक्षम सक्षम?) ते / ते करते

?????? सह, ते “कॅन /? /?” होते, दुसर्‍या शब्दांत, “कुंग फू”, जेव्हा ओळ अप करते आणि / नावाचे डोके बदलते.

?????? असे म्हटले जाते की अतिरिक्त दोन वाढवल्यास ते कोणत्या प्रकारचे नाव असू शकते.

सत्य हे "वय" असे म्हटले जाते कारण चांदीचे घटक प्रतीक Ag आहे, जरी "द ????" चांदी ”टाकाओका? चे तंत्रज्ञ ??????? त्या पात्राला “?” असे म्हणतात की? त्यास अतिरिक्त सदस्यासह कॉल केल्यास सिल्व्हर स्क्रीन? चित्रपटाच्या संबद्धतेसह वापरण्यात आले.

?????? तथापि, मी स्वार्थीपणे विचार करतो आहे की माझा सिद्धांत असंबंधित नाही “?” एक / चीनी वर्ण समाविष्ट आहे.

मला खात्री आहे की या भाषांतराचे ध्रुवकरण उलगडणे इंग्रजीत वाचन करण्यासारखे वाचन आहे. तुम्हाला एन्ट्री समजली, बरोबर?

2 टिप्पणी

 1. 1

  तुम्हाला परड्यू म्हणायचे आहे का?
  निश्चितच - एक घाम गाळणारा रेडिओ अभिनेता काही गोष्टी सांगण्यासाठी योग्य मार्गाने विचार करीत होता….

तुला काय वाटत?

ही साइट स्पॅम कमी करण्यासाठी अकिस्मेट वापरते आपल्या टिप्पणी डेटावर प्रक्रिया कशी केली जाते ते जाणून घ्या.