Unicode: Bag gardinet

Unicode Consortium fejrede sit 25 -års jubilæum sidste år. Sandheden er, at trods alt det arbejde, Unicode gør for at sikre tekst fra sprog rundt om i verdensarbejde – kender de fleste af os Unicode som gruppen, der godkender nye emojier.
Det, der måske ikke er så klart, er, hvorfor der kræves et stort konsortium eller den skjulte kompleksitet af Unicode. Eller hvordan opkastemojierne, der er vist i XCKD -tegneserien ovenfor, betragtes allerede som “gyldige (men ikke anbefalet)”.

Mark Davis, medstifter og nuværende præsident for Unicode, har forsøgt at afklare, hvordan Emoji passer ind i Unicode i denne oversigt på højt niveau, der ser på, hvad Unicode er, og hvordan Unicode Emoji-underudvalget (“Emoji SC”) passer ind i det.
Davis bemærker, at emojier kun udgør en brøkdel af det samlede antal tegn i Unicode -standarden. Du kan næppe gøre dem ud i dette diagram:

Tegn alene fortæller ikke halvdelen af ​​historien. Et antal glyfer skal kombineres, når de vises i visse ordrer eller kombinationer.

En kombination, der vil være kendt for mange, er, hvordan emoji hudfarver implementeres.
Disse fungerer ved at registrere, når en modifikatorkarakter vises efter menneskelig emoji, såsom 👧 pige. Disse kombineres på understøttede platforme for at vise en enkelt emoji:

En mere kompliceret implementering involverer at deltage i to eller flere emojier sammen til det, der kaldes en Emoji ZWJ -sekvens.
Disse bruges til at skabe erhverv som 👩‍⚖ kvindens dommer. Denne emoji oprettes ved hjælp af 👩 Woman and ⚖ Balance Scale Emoji i rækkefølge.
En “ZWJ” (nul bredde snedker) karakter står mellem disse to emojier og er en usynlig lim, der forbinder flere emojier i en (hvor understøttet).

Andre typer ZWJ -sekvenser viser en eksisterende emoji, såsom 🕵 Detektiv med et kønssymbol ♀ Kvindelig tegn tilføjet efter det.
Denne type ZWJ -sekvens bruges generelt, hvis der allerede findes en emoji. For eksempel: løber, surfer eller mange af bevægelserne.

Og ja, du kan kombinere modifikatorer og ZWJ’er for at skabe en længere sekvens.

Unicode kontrollerer ikke ZWJ -sekvenser på samme måde som nye emojier, der kræver deres eget kodepunkt.
Unicode anbefalede sekvenser, der skal understøttes til tværplatformkonsistens. Imidlertid er leverandører frie til at kombinere enhver emoji med enhver anden, som de finder passende.
Microsoft har seks ninja -katte tilgængelige i Windows, som ikke er en del af Unicodes anbefalede liste. 🐱 Cat Face og 🚀 Raket kombineres på Windows 10 for at vise en emoji for 🐱‍🚀 Astro Cat.
Astro Cat er gyldig (da den bruger en korrekt sekvensstruktur), men ikke anbefales som andre erhverv og køn er.

XKCD foreslog, at opkast skulle være en modifikatorkarakter til at lave en “opkast cowboy”.
Davis påpeger, at 🤠 Cowboy Hat -ansigt allerede kunne kombineres med 🤮 Ansigt opkast for at skabe en gyldig ZWJ -sekvens:

Andre sekvenstyper findes for emoji, herunder flagsekvenser, tagsekvenser og nøglecap -sekvenser. Du bør tjekke hele sæt lysbilleder for at se disse mere detaljeret.
Endelig et kig på den (nuværende, 2017) tidslinje for, hvordan en ny emoji fødes:

🚨 Opdatering april 2020: Den aktuelle tidslinje for, hvordan en ny emoji er oprettet, er blevet påvirket markant af Covid-19-pandemien. Du kan læse mere om den reviderede tidsplan for 2020 og videre her.
Selvfølgelig har Unicode stadig masser at gøre uden for emoji -support:

“Der er cirka 7.000 levende menneskelige sprog med forskellige niveauer af vitalitet. Mindre end 100 af disse sprog understøttes godt på computere, mobiltelefoner og andre enheder, mens alle resten risikerer at være digitalt dårligt stillede”

Unicode har et vedtagelse af et karakterprogram. Midler, der er indsamlet fra adoptioner, går mod forskning for at støtte disse digitalt dårligt stillede sprog.
Mere:

Unicode Emoji af Mark Davis
Unicode vedtager en karakter
Nye emojier til 2017
Sjove emoji -hacks

Search Emojis: