<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
/* List Definitions */
@list l0
        {mso-list-id:480315398;
        mso-list-template-ids:-481527600;}
ol
        {margin-bottom:0in;}
ul
        {margin-bottom:0in;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Something to consider: While highlighting potential benefits in relation to characters that are used only very rarely (in general—there might be local exceptions for some place names), you don’t mention the problems that would be created
 for the vast majority of much-more-frequently used ideographs, as well as the down-sides for those rare characters. For example, the IDS scheme would never be supported in IDNA, so that town name could never be used in a domain name.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Peter<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Unicode <unicode-bounces@corp.unicode.org> <b>On Behalf Of
</b>Abraham Gross via Unicode<br>
<b>Sent:</b> Tuesday, November 2, 2021 6:03 PM<br>
<b>To:</b> unicode@corp.unicode.org<br>
<b>Subject:</b> New CJK characters<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial",sans-serif">I have a proposal regarding the future of encoding new Unihan characters into Unicode that I'd like to float by this group to see if it makes any sense.<br>
<br>
New CJK characters keep on being encoded and it doesn't seem to be slowing down. This is to the point where there are now in unicode 92,856 CJK characters!<br>
<br>
I think that going forward, it would make a lot of sense if instead of encoding each new character as a separate codepoint, we adopt a paradigm like that of
<a href="https://na01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fen.wikipedia.org%2Fwiki%2FSutton_SignWriting_(Unicode_block)&data=04%7C01%7C%7C56e383ef29d04433831808d99e66be5c%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C637714986385950571%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C1000&sdata=Mn2%2Bhkgt9CeUxH7jLPCp%2F6mU6LbPdqaQdm1JBT1EDBI%3D&reserved=0" target="_blank">
Sutton SIgnwriting </a>- where Unicode would provide a set of all radicals and position/sizing modifiers - and anyone that wants to use any arbitrary non-encoded character would be able to just combine the radicals the right way (by using a gui designed for
 this, à la glyphwiki.org's or Wenlin's editor), and then be able to use the character right away. This would work because the font would have to support for all the basic strokes, and since all CJK characters are comprised of the basic strokes, the font will
 be able to put the character together without the need for a font maker to specifically create that character.<br>
<br>
This method of "encoding" would solve many problems we have now:<o:p></o:p></span></p>
</div>
<ol start="1" type="1">
<li class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;mso-list:l0 level1 lfo1">
<span style="font-size:10.0pt;font-family:"Arial",sans-serif">Non encoded characters can be used without the need to wait years for the character to be accepted into Unicode, and then a couple more years until the major OSes update their fonts to support the
 new characters.<o:p></o:p></span></li><li class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;mso-list:l0 level1 lfo1">
<span style="font-size:10.0pt;font-family:"Arial",sans-serif">This is in my opinion a really neat solution to the gaiji problem (<a href="https://na01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fen.wikipedia.org%2Fwiki%2FOpenType%23SING_gaiji_solution&data=04%7C01%7C%7C56e383ef29d04433831808d99e66be5c%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C637714986385960565%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C1000&sdata=x2pfzaVjYj4uEO772mWLtK7C124YlzfPcJXJzGt%2BMCc%3D&reserved=0" target="_blank">described
 here</a>).<o:p></o:p></span></li><li class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;mso-list:l0 level1 lfo1">
<span style="font-size:10.0pt;font-family:"Arial",sans-serif">This would also give way to much more rapid font development time, since you'd only need to create the basic strokes and some radicals to get a working version of the font, then all other characters
 would just be refining the exact stroke size/positioning.<o:p></o:p></span></li><li class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;mso-list:l0 level1 lfo1">
<span style="font-size:10.0pt;font-family:"Arial",sans-serif">Most CJK fonts only have a small subset of all available characters. This will allow for all fonts to support any character you wish - including ones you dream up.<o:p></o:p></span></li><li class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto;mso-list:l0 level1 lfo1">
<span style="font-size:10.0pt;font-family:"Arial",sans-serif">People have been coming up with new CJK characters for thousands of years, including nowadays (<a href="https://na01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fsousaku-kanji.com%2Farchive.html&data=04%7C01%7C%7C56e383ef29d04433831808d99e66be5c%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C637714986385960565%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C1000&sdata=qq5EI%2FRGpX7IkdBTIRotux%2Bn1AFaltlQKvLxi1%2Buv3I%3D&reserved=0" target="_blank">here's
 a new-kanji competition for example</a>), but any new characters created nowadays would be extremely hard to get into Unicode since Unicode requires proof of use before they accept a proposal, but how are people supposed to use a character if they can't type
 it.<o:p></o:p></span></li></ol>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial",sans-serif">I still think that Unicode should keep track of new characters in a Nameslist of sorts so that font makers have a base to go off of.<br>
<br>
Q: My (city) name has a character that isn't encoded. How can I type it quickly without needing to open up an editor and creating it each time?<br>
A: Adding them to your IME's dictionary would allow you to just create the character once.<br>
- This can be extended in such a way where an IME can be fully formed entirely out of preconstructed characters instead of codepoints.<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial",sans-serif"><br>
Q: What would the specifics of such a system look like behind the scenes?<br>
A: I'm not sure yet, but I think Wenlin's <a href="https://na01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fguide.wenlininstitute.org%2Fwenlin4.3%2FCharacter_Description_Language&data=04%7C01%7C%7C56e383ef29d04433831808d99e66be5c%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C637714986385970559%7CUnknown%7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0%3D%7C1000&sdata=W8fUMF0C3NRVHwCTnMESXkd3p5CylkTCIdg5PZweO90%3D&reserved=0" target="_blank">
CDL</a> would be a good place to start.<o:p></o:p></span></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>