सामग्री विपणन

आंतरराष्ट्रीयकरण, स्थानिकीकरण, एन्कोडिंग, आइसलँड आणि जपानी मांजरीच्या फोटो वेबसाइटचे भाषांतर

आंतरराष्ट्रीयकरणजेव्हा आंतरराष्ट्रीयकरण, स्थानिकरण आणि वेब अनुप्रयोगांमध्ये एन्कोडिंगचा विचार केला जातो तेव्हा तेथे बरेच माहिती असते. प्रत्येक वेब अनुप्रयोगासाठी काय प्रदान करते याबद्दल बरेच गैरसमज देखील आहेत. हे माझे घ्या…

जेव्हा एखादा वेब ब्राउझर वेब सर्व्हरशी कनेक्शन बनवितो, तेव्हा तो थोडाफार बदल करून अतिरिक्त विनंत्या करतो, येथे एक उदाहरणः

GET / HTTP / 1.1
होस्टः www.dknewmedia.com
वापरकर्ता-एजंट: मोझीला / 5.0 (मॅकिंटोश; यू; इंटेल मॅक ओएस एक्स; एन-यूएस; आरव्ही: 1.8.1.3) गेको / 20070309 फायरफॉक्स / 2.0.0.3
स्वीकारा: HTTP स्वीकार = मजकूर / एक्सएमएल, अनुप्रयोग / एक्सएमएल, अनुप्रयोग / एक्सएचटीएमएल + एक्सएमएल, मजकूर / एचटीएमएल; क्यू = 0.9, मजकूर / साधा; क्यू = 0.8, प्रतिमा / पीएनजी, * / *; क्यू = 0.5
स्वीकृती-भाषाः एन-यूएस, एन; क्यू = 0.5
स्वीकारा-एन्कोडिंगः जीझिप, डिफलेट
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

आंतरराष्ट्रीयकरण

आंतरराष्ट्रीयकरण ही बर्‍याच गोष्टींचे मिश्रण आहे:

  1. स्थानिकीकरण: अभ्यागत कोणती भाषा आणि स्थान भेट देत आहेत हे ओळखण्याची क्षमता. हे HTTP विनंत्यांद्वारे केले जाते जेथे अभ्यागतांना लोकॅलद्वारे ओळखले जाते. माझ्या बाबतीत, ते एन-यूएस आहे. “इं” इंग्रजी आहे आणि “यूएस” युनायटेड स्टेट्स आहे. माझ्या ऑपरेटिंग सिस्टममध्ये ही एक सेटिंग आहे.
  2. वेळ क्षेत्र: टाइम झोनसाठी समायोजित करण्याची क्षमता. हे सहसा आपल्या सर्व्हरला ग्रीनविच मीन टाइम (जीएमटी) वर सेट करून आणि नंतर वापरकर्त्यांना जीएमटीमधून त्यांचे स्थानिक ऑफसेट सेट करण्याची परवानगी देऊन पूर्ण केले जाते.
  3. कॅरेक्टर एन्कोडिंग: भाषेचे वर्ण योग्यरित्या सेट करण्याची ही क्षमता आहे. हे लोकलायझेशनपेक्षा भिन्न आहे कारण स्थानिकीकरण संगणकाची भाषा आणि क्षेत्र ज्याकडून विनंती करीत आहे ते मला सांगू शकते, परंतु ती कोणती भाषा मला सांगणार नाही वाचक विनंती करीत आहे… हे वाचकांवर अवलंबून आहे!

जेव्हा ब्राउझरने विनंती केली तेव्हा माझ्या HTTP शीर्षलेखातील सूचना, सर्व्हरला सांगितले की ते माझ्या लोकॅलची विनंती करीत आहे (स्वीकार करा भाषा: एन-यूएस); तथापि, सर्व्हरला कॅरॅक्टर सेटची विनंती काय आहे हे देखील सांगणे आवश्यक आहे (एक्सेप्ट-चारसेट: एक्सेप्ट-चारसेट: आयएसओ -8859-1, यूटीएफ -8; क्यू = 0.7, *; क्यू = 0.7) आयएसओ -8859-1 आणि यूटीएफ -8 हे दोन्ही परवानगीचे पात्र संच आहेत.

स्थानिकीकरण

या विलक्षण मिश्रित जगात स्थानिकीकरण यापुढे कधीही भाषेचे हुकूम देत नाही. जरी मी एन-यूएसमध्ये आहे, तरीही मी भिन्न कॅरेक्टर सेट वापरुन भिन्न भाषा वाचू शकतो ... मी वापरतो तेव्हा असेच होते गूगल हिंदी (मी खरोखर Google हिंदी वापरत नाही). माझी लोकॅल आणि कॅरॅक्टर सेटसाठीची विनंती मी जेव्हा विनंती केली त्याचप्रमाणेच आहे गूगल इंग्रजी पृष्ठ, परंतु मी प्रत्यक्षात एक पृष्ठ दिले आहे जे मी वाचू शकत नाही कारण माझ्याकडे वर्ण संच नाही. हे सर्व येत आहे ???????????? तथापि, मी ते वर्ण फायरफॉक्स (फायरफॉक्स> प्राधान्ये> प्रगत> भाषा) मध्ये लोड करू शकतो:

फायरफॉक्स लोड भाषा

मी ती भाषा लोड करीत असल्यास, नंतर मी माझ्या मूळ वर्ण सेटमध्ये पृष्ठाची विनंती करु आणि माझ्या संगणकावर ते प्रदर्शित करू शकलो तरीही माझे डीफॉल्ट लोकेशन एन-यूएस आहे!

तर… मी एक हिंदी विद्यार्थी असल्यास, पर्ड्यू येथे इंग्रजी शिकत आहे आणि त्याद्वारे कनेक्ट आहे व्हीपीएन ऑस्ट्रेलियात सुट्टीवर असलेल्या शाळेच्या सर्व्हरवर… अशा 3 वेगवेगळ्या सेटिंग्ज आहेत ज्यांचा ख truly्या अर्थाने आंतरराष्ट्रीयकरण करण्यासाठी अर्ज करण्याची आवश्यकता आहे - आणि काहीही नाही इतर अवलंबून

माझे स्थान एन-यूएस म्हणून पुढे येईल, परंतु माझा टाईमझोन ऑस्ट्रेलिया आहे, परंतु वेबसाइटवरून मी विनंती करत असलेली भाषा हिंदी असू शकते. मी अर्ज करण्यासाठी माझा अर्ज करत असल्यास धारणा माझ्या संगणकाच्या लोकॅलवर आधारित, मी पूर्णपणे चुकीचे आहे - ईस्टर्न टाइमझोनमध्ये त्या व्यक्तीला इंग्रजी खायला घालतो. तद्वतच, मी माझा अनुप्रयोग ऑफर करण्यासाठी प्रोग्राम करेन दोन्ही भाषा आणि टाइमझोन सेटिंग्ज… परंतु मी त्या लोकॅलवर आधारित गृहीत धरत नाही.

आईसलँड - अंतिम उदाहरण

आम्ही जेथे आहोत तेथे युनायटेड स्टेट्समध्ये बहुभाषिक आणि बहु-भाषेच्या आव्हानांविषयी आम्ही दुर्लक्ष करतो सर्व इंग्रजी बोला [उपहासात्मक निहित]. आईसलँडसारख्या काही देशांमध्ये मूळ भाषा आइसलँडिक असली तरी अविश्वसनीय आइसलँडिक लोक 3 भाषा शिकत वाढतात! आईसलँड हा युरोप आणि उत्तर अमेरिकेच्या मध्यभागी असलेला देश असल्याने त्यांच्या कंपन्या त्यांच्या डेस्कटॉपवरून एकाधिक खंड, भाषा, भाषांचे बोलीभाषा आणि एकाधिक टाईमझोनवर काम करतात!

बर्‍याच आइसलँडिक वेबसाइट्स यूएस इंग्रजी, यूके इंग्रजी, आइसलँडिक, स्पॅनिश, स्पॅनिश, फ्रेंच आणि जर्मनमध्ये तयार केल्या आहेत! ते तयार करणे किती आव्हानात्मक असेल याची कल्पना करा आईसलँडेरचा वेबसाइट अनुप्रयोग आणि तिकीट प्रणाली ... व्वा!

अस्वीकरणः आईसलँडियरच्या चांगल्या लोकांसोबत काम करण्याचा मला पूर्णपणे आनंद झाला आणि मी सांगू शकतो की ते काम करणारे सर्वात प्रतिभावान आणि मैत्रीपूर्ण व्यावसायिक आहेत ज्यात मला काम करण्याची आवड आहे. हे फक्त एक आश्चर्यकारक देश आणि लोक आहे! भेट द्या ... आईसलँडॅर घ्या आणि नक्की भेट द्या Blue Lagoon!

एन्कोडिंग विरूद्ध भाषा

एका भाषेमध्ये भिन्न वर्णांची एन्कोडिंग्ज आहेत जी एकमेकांशी चांगले खेळत नाहीत! उदाहरणः शिफ्ट-जेआयएस मध्ये लिहिलेले एक जपानी ईमेल जपानी-जेपी वर सेट केलेल्या लोकॅलायझेशनसह जपानी व्यक्तीच्या संगणकावर अवाचनीय रेंडर करू शकते कारण त्यांचा मेल सर्व्हर केवळ EUC-JP ओळखतो. तद्वतच, ग्राहक एन्कोडिंग आणि कोणती भाषा ग्राहकांना विनंती करीत आहे त्यानुसार सुसंगत आहे याची खात्री करुन - कोणत्या एन्कोडिंगला तसेच कोणती भाषा त्यांना पाहिजे ते सेट करण्यास सक्षम असावे.

जर मला जपानी भाषा वाचायचं असेल तर ती भाषा योग्यप्रदर्शित करण्यासाठी एन्कोडिंगसाठी मला माझी भाषा आणि Shift-JIS या दोघांची निवड करावी लागेल. मिश्रणात जोडण्यासाठी येथे आणखी एक गोंधळ आहे ... काही एन्कोडिंग प्रकार बर्‍याच भाषांना समर्थन देतात. युनिकोड / यूटीएफ 8 डझनभर लोकांना समर्थन देते. उलट देखील खरे आहे. काही भाषा बर्‍याच एन्कोडिंग प्रकारांमध्ये वाचल्या जाऊ शकतात. जर त्याचा अर्थ नसेल तर ... मी दिलगीर आहोत, ही एक अतिशय गुंतागुंतीची समस्या आहे.

एखाद्या दिवशी माझा विश्वास आहे (आशा आहे) हे सर्व बदलेल. मला वाटते की लोकॅलायझेशन कोडच्या मूळ डिझाइनर्सना अशी आशा होती की भाषा-देशी कॉम्बो आवश्यक असलेल्या सर्व गोष्टींमध्ये असेल ... परंतु आम्ही बरेच अधिक परिष्कृत झालो आहोत. लक्षात ठेवा यापैकी बरेच काही इंटरनेट अस्तित्त्वात येण्यापूर्वी विकसित केले गेले होते. च्या आगमनाने जीआयएस, कदाचित एखादी व्यक्ती त्यांचे एन्कोडिंग निवडू शकेल आणि जीआयएस टाईमझोन आणि स्थानिक माहिती हाताळू शकेल.

आंतरराष्ट्रीयकरण

आंतरराष्ट्रीयकरण आधारावर परत. आपण आंतरराष्ट्रीयकरण अनुप्रयोग प्रदान करू इच्छित असल्यास, आपल्याला हे करणे आवश्यक आहे:

  1. एकाधिक एन्कोडिंग प्रकार, भाषा आणि त्या अनुवाद प्रदर्शित करण्यासाठी भाषांतर फायली असण्याचे समर्थन करा.
  2. क्लायंटला त्यांची भाषा आणि कदाचित आवश्यक असल्यास त्यांचा एन्कोडिंग प्रकार सेट करण्याची परवानगी द्या.
  3. जीएमटीच्या तुलनेत वापरकर्त्यांना त्यांच्या टाईमझोनचा संदर्भ देण्याची परवानगी देऊन वेळ क्षेत्रांचे समर्थन करा.
  4. सावधगिरीने लोकलायझेशन कोडचा उपयोग करा… आपला वापरकर्ता प्रत्यक्षात काय विनंती करीत आहे किंवा ते काय वाचू शकतात हे ते अचूकपणे दर्शवित नाहीत.

भाषांतर

मशीन भाषांतर अद्याप सुरुवातीच्या काळात आहे. तेथे बर्‍याच वेबसाइट्स आहेत (आणि वर्डप्रेस प्लगइन) आपल्या साइटचे मशीन भाषांतर ऑफर करते. असे करण्याचा मोह होऊ नका… अशी दोन कारणे आहेतः

  1. मशीन भाषांतर कार्य करत असल्यास, आपल्या साइटची तपासणी करीत असलेल्या वापरकर्त्याकडे आधीपासूनच कार्य करण्यासाठी अनुवादक असेल.
  2. मशीन भाषांतर निराशेचा उदगार.

माझ्यावर विश्वास ठेवू नका? आपल्यासाठी येथे एक जपानी अनुवाद आहे:
पासून पेस्ट केले मसात्सु फाईल - मांजरींच्या टन टन चित्रे असलेले एक मित्र:

जपानी ब्लॉग एंट्री

????????????
- 00:29:35 मसात्सु द्वारे

??????????????????????????????
????????????????????????????

???????????? (?)?

???????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?????????????????????????????????????????????????

??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

??????????????????

???????????????
????????????
????????????

??????????????????????????????????????????????????????????????????????????????????????????????

???????????????????????????????

????????????????????????????????????????????????????????????????????????????????????????????????????????????????
?????????????????????????????????????????????????
??????????? अग ???????????????

???????????????????????????????????????????????????????????????????????????????????????????????????????????????????

मशीन भाषांतर:

?? हान ?????
-00: 29: 35 मसात्सू द्वारे

कालच्या “अ / पशूची मुठ्ठी चपळ” वर दिसणार्‍या / हत्तीच्या मुट्ठी संतचे नाव? रेंजर ”“ ?? हान ???? ” एक / रेडिओ अभिनेता Yutaka Mizushima सह….

? (?) जे कटलफिश सहजतेने करते.

कारण अगदी मुट्ठी संत, मास्टर रेडिओ अभिनेता ????? एक / मांजरीची नगाई इचिरो ची चिनी रानी आहे = ड्रॅगन बॉल / च्या स्टाफचा ?? रेंजर अशा लोकांसारखे दिसतात जे विनोदी टिप्पणी सहजपणे ओळखतात.

?????? (घाम) जो मी या वर्षी पूर्णपणे विसरत होतो, दरवर्षी नेहमीच्या सरावाचे “सुपर फ्लीटच्या नावाचे रहस्य” ?,

?????? मी यावर्षी निर्दोषपणे लिहिल्यास,

??????? मंदिर ??? (कसे?)? हेडलँड कुलियन (?? कट नाही) फुकमी ?? (? किंवा सक्षम सक्षम?) ते / ते करते

?????? सह, ते “कॅन /? /?” होते, दुसर्‍या शब्दांत, “कुंग फू”, जेव्हा ओळ अप करते आणि / नावाचे डोके बदलते.

?????? असे म्हटले जाते की अतिरिक्त दोन वाढवल्यास ते कोणत्या प्रकारचे नाव असू शकते.

सत्य हे "वय" असे म्हटले जाते कारण चांदीचे घटक प्रतीक Ag आहे, जरी "द ????" चांदी ”टाकाओका? चे तंत्रज्ञ ??????? त्या पात्राला “?” असे म्हणतात की? त्यास अतिरिक्त सदस्यासह कॉल केल्यास सिल्व्हरस्क्रीन? चित्रपटाच्या संबद्धतेसह वापरण्यात आले.

?????? तथापि, मी स्वार्थीपणे विचार करतो आहे की माझा सिद्धांत असंबंधित नाही “?” एक / चीनी वर्ण समाविष्ट आहे.

मला खात्री आहे की या भाषांतराचे ध्रुवकरण उलगडणे इंग्रजीत वाचन करण्यासारखे वाचन आहे. तुम्हाला एन्ट्री समजली, बरोबर?

Douglas Karr

Douglas Karr चे CMO आहे ओपनइनसाइट्स आणि चे संस्थापक Martech Zone. डग्लसने डझनभर यशस्वी MarTech स्टार्टअप्सना मदत केली आहे, Martech अधिग्रहण आणि गुंतवणुकीमध्ये $5 बिलियन पेक्षा जास्त योग्य परिश्रमात मदत केली आहे आणि कंपन्यांना त्यांच्या विक्री आणि विपणन धोरणांची अंमलबजावणी आणि स्वयंचलित करण्यात मदत करणे सुरू ठेवले आहे. डग्लस हा आंतरराष्ट्रीय स्तरावर मान्यताप्राप्त डिजिटल ट्रान्सफॉर्मेशन आणि MarTech तज्ञ आणि स्पीकर आहे. डग्लस हे डमीच्या मार्गदर्शक आणि व्यवसाय नेतृत्व पुस्तकाचे प्रकाशित लेखक देखील आहेत.

संबंधित लेख

परत शीर्षस्थानी बटण
बंद

अॅडब्लॉक आढळले

Martech Zone तुम्हाला ही सामग्री कोणत्याही खर्चाशिवाय प्रदान करण्यात सक्षम आहे कारण आम्ही आमच्या साइटवर जाहिरात महसूल, संलग्न दुवे आणि प्रायोजकत्वाद्वारे कमाई करतो. तुम्ही आमची साइट पाहता तेव्हा तुमचा अॅड ब्लॉकर काढून टाकल्यास आम्ही कृतज्ञ आहोत.