<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">+1<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> Unicore <unicore-bounces@unicode.org>
<b>On Behalf Of </b>Tex via Unicore<br>
<b>Sent:</b> Thursday, July 30, 2020 3:24 PM<br>
<b>To:</b> 'Markus Scherer' <markus.icu@gmail.com>; 'John Hudson' <john@tiro.ca>; unicore@unicode.org<br>
<b>Subject:</b> RE: Proposed letters, 0C5B & 0C5C, in Telugu<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal" style="text-indent:.5in"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#002060">“</span></b><b><span style="font-family:"Calibri",sans-serif">Writing systems are shared by multiple languages and multiple traditions,
 past and present.”<o:p></o:p></span></b></p>
<p class="MsoNormal"><b><span style="font-family:"Calibri",sans-serif"><o:p> </o:p></span></b></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif">That statement should be a key point made prominently (and repeatedly) in introductions to Unicode, scripts, etc.
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif">It is an underlying foundation that needs to be understood and it mitigates the many objections based on personal or community experiences.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif">Well stated Markus.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif">Tex<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#002060"><o:p> </o:p></span></b></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#002060"><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma",sans-serif"> Unicore [<a href="mailto:unicore-bounces@unicode.org">mailto:unicore-bounces@unicode.org</a>]
<b>On Behalf Of </b>Markus Scherer via Unicore<br>
<b>Sent:</b> Thursday, July 30, 2020 1:10 PM<br>
<b>To:</b> John Hudson<br>
<b>Cc:</b> unicore UnicoRe Discussion<br>
<b>Subject:</b> Re: Proposed letters, 0C5B & 0C5C, in Telugu<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">On Thu, Jul 30, 2020 at 11:20 AM John Hudson via Unicore <<a href="mailto:unicore@unicode.org">unicore@unicode.org</a>> wrote:<o:p></o:p></p>
</div>
<div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0in;margin-bottom:5.0pt">
<p class="MsoNormal">there is a reasonable, general question to ask about sufficiency of
<br>
attestation when it comes to very rare characters that might only occur <br>
in one or two texts, perhaps the invention of a single author, not <br>
embraced by any subsequent tradition of use. And one response to that <br>
question is 'Any attestation is sufficient', which has the benefit of <br>
removing the need to come up with applicable critieria of sufficiency <br>
that would need to be considered on a case-by-case basis.<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Right. As far as I understand, there are thousands of Chinese characters that have been used very rarely, or even just once in a dictionary or in a database of person names. They are real, they are encoded, but they are not common.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Implementers have to make choices, and sometimes it makes sense to support a subset.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">If a font or keyboard vendor wants to support the entire Sinhala
<i><u>script</u></i>, then they will have glyphs for all relevant code points -- whether inside or outside the Sinhala block -- and all relevant
<i>sequences</i>, and punctuation, etc.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">If someone cares to only support the subset needed for common, modern use of the Sinhala
<i><u>language</u></i>, then they can define such subsets or look for organizations that have defined them. (E.g., Unicode CLDR has sets of "exemplar characters" for many languages.)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I understand a visceral reaction of "this does not belong". I was originally not in favor of adding a
<a href="https://en.wikipedia.org/wiki/Capital_%E1%BA%9E">capital sharp s</a> (Latin script, German language) because it was not part of the German orthography and wasn't taught in school etc. However, it clearly existed and was used, and once evidence was
 presented showing that it was more than using a lowercase ß in all-caps words, it got added to the Unicode standard, and the official orthography now acknowledges it (as optional).<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Writing systems are shared by multiple languages and multiple traditions, past and present.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Best regards,<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">markus<o:p></o:p></p>
</div>
</div>
</div>
</div>
</body>
</html>