<div dir="ltr"><div dir="ltr">On Tue, Dec 3, 2024 at 12:05 AM Daniel Buncic via Unicode <<a href="mailto:unicode@corp.unicode.org">unicode@corp.unicode.org</a>> wrote:</div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Thank you very much for the idea.  I could certainly sum up the <br>
arguments of the discussion (though I’m too busy to do it right now, you <br>
would have to have a few weeks’ patience), but I still haven’t <br>
understood where in the CLDR such casing information is stored.</blockquote><div><br></div><div>CLDR has "transform" data for case mappings, but practical case mapping functions, as implemented in libraries like ICU and ICU4X, are very low-level, and hardcode exceptional cases.</div><div><br></div><div>I have implemented most of the ICU case mapping/case folding functions. Their behavior mostly follows the Unicode Standard core spec and data files -- including what SpecialCasing.txt says but handling most of that in code.</div><div>Over time, we have added and refined language-specific case mappings for Dutch (IJ), Armenian (a ligature that has gotten reinterpreted), and modern Greek ("drop accents" but with exceptions on exceptions).</div><div><br></div><div>There is a CLDR ticket for documenting all of this in the CLDR spec (UTS #35).</div><div><br></div><div>For uppercasing ß to ẞ rather than SS, we have this ticket: <a href="https://unicode-org.atlassian.net/browse/CLDR-17624">https://unicode-org.atlassian.net/browse/CLDR-17624</a></div><div>I have added some information there from this thread.</div><div><br></div><div>And that is why I am engaging in this thread and looking for evidence that ẞ is replacing SS (and ß) in German all-uppercase text.</div><div>I am looking for a noticeable increase in relative frequency, not one-offs.</div><div><br></div><div>Another way to approach this, also discussed in that ticket, is to add some kind of explicit option that lets one choose the uppercasing behavior of ß. Given how low-level uppercase functions are and what limited inputs they take, that is also not an easy problem.</div><div>It might in some ways be easier if the new behavior had become widespread already, so that implementers could just change their code for most contexts.</div><div><br></div><div>Viele Grüße,</div><div>markus</div></div></div>