<div dir="ltr"><div class="gmail_default" style="font-family:times new roman,serif">Kip, would you mind filing a ticket on this, so that we can track it?</div><div class="gmail_default" style="font-family:times new roman,serif"><br></div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><font face="'times new roman', serif"><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px"><div></div></div><div style="background-color:transparent;margin-top:0px;margin-left:0px;margin-bottom:0px;margin-right:0px">Mark</div></font><div><div><font face="'times new roman', serif"><i><span style="font-style:normal"><i></i></span><i></i></i></font></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Mar 29, 2021 at 7:27 AM Mark Davis ☕️ <<a href="mailto:mark@macchiato.com">mark@macchiato.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div class="gmail_default" style="font-family:"times new roman",serif">Thanks for your message. There is more information in <a href="https://unicode-org.github.io/icu/userguide/transforms/general/" target="_blank">https://unicode-org.github.io/icu/userguide/transforms/general/</a> that should be incorporated into the LDML section. As to your particular points.</div><div class="gmail_default" style="font-family:"times new roman",serif"><br></div><div class="gmail_default" style="font-family:"times new roman",serif">I have some answers below, but I can follow up with details of the edge cases when I have more time.</div><div class="gmail_default" style="font-family:"times new roman",serif"><br></div><div><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><font face="'times new roman', serif"><div style="background-color:transparent;margin:0px"><div></div></div><div style="background-color:transparent;margin:0px">Mark</div></font><div><div><font face="'times new roman', serif"><i><span style="font-style:normal"><i></i></span><i></i></i></font></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Mar 29, 2021 at 6:58 AM Kip Cole via CLDR-Users <<a href="mailto:cldr-users@unicode.org" target="_blank">cldr-users@unicode.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">I’m now implementing CLDR transforms and would appreciate some understanding of the following two items:<br>
<br>
1. Resolving the correct transform from “Any-Latin”. For example, “de-Latin” has a transform rule “Any-Latin” but such a transform doesn’t exist in the repo. So I presume an appropriate transform has to be resolved. Reading the inheritance rules isn’t helping me. So using this example, how does one resolve the correct transform for “Any-Latin”.<br></blockquote><div><br></div><div class="gmail_default" style="font-family:"times new roman",serif">There are special inheritance rules for Transforms with locales. </div><div class="gmail_default" style="font-family:"times new roman",serif"><ul><li>Any is a special identifier that breaks text by script run, and within that script run is replaced by the script of the run.</li><li>The fallback if there is not a language is language => script. The fallback is a 'ladder' between the source and target</li><li></li></ul></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
2. I’m not sure how to interpret the Unicode regular expression "[[:Z:][:Ps:][:Pi:]$]” when its in a “before context” as it is in “Any-Publishing.xml” Specifically, where does the “$” anchor? <br>
<br>
  (a) Does “$” in this case mean matching the character just before the insertion point? Or does it mean maches an end-of-line at the insertion point? Or something else?<br></blockquote><div><br></div><div class="gmail_default" style="font-family:"times new roman",serif">It means "off the end of the string". So it is like ^ or $ in regular expressions.</div><div class="gmail_default" style="font-family:"times new roman",serif"></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
  (b) For the majority of “before context” matches, which don’t have any anchors in them (“$” or “^”) is the intent that the match aligns to the text immediately before the insertion point (ie with an implied “$” ending at the insertion point). Or is it intended to match anywhere in the prior context from the begging of the string (that would seem strange but TR35 doesn’t seem to explain the correct interpretation and TR18 is silent on the topic).</blockquote><div><br></div><div class="gmail_default" style="font-family:"times new roman",serif">It is immediately before.</div><div class="gmail_default" style="font-family:"times new roman",serif"></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"> <br>
<br>
As always, thanks for the insight and assistance,<br>
<br>
—Kip<br>
<br>
<br>
_______________________________________________<br>
CLDR-Users mailing list<br>
<a href="mailto:CLDR-Users@corp.unicode.org" target="_blank">CLDR-Users@corp.unicode.org</a><br>
<a href="https://corp.unicode.org/mailman/listinfo/cldr-users" rel="noreferrer" target="_blank">https://corp.unicode.org/mailman/listinfo/cldr-users</a><br>
</blockquote></div></div>
</blockquote></div>