<div dir="ltr"><div dir="ltr">On Thu, Aug 11, 2022 at 10:21 PM Richard Wordingham via Unicode <<a href="mailto:unicode@corp.unicode.org">unicode@corp.unicode.org</a>> wrote:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">May a process conforming to Unicode requirement C6 (TUS Section 3.2),<br>
"A process shall not assume that the interpretations of two<br>
canonical-equivalent character sequences are distinct", consider the<br>
Unicode set<br>
<br>
[\p{sc = Greek}&&\p{sc ≠ Greek}]<br>
<br>
to be non-empty?<br></blockquote><div><br></div><div>Regardless of other considerations, a set and its inverse are disjoint.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">The problem is that the canonically equivalent characters U+00B4 ACUTE<br>
ACCENT and U+1FFD GREEK OXIA have conflicting script properties, but a<br>
Unicode-conformant process may freely interchange the two characters<br>
whenever they appear as part of a string (Conformance Requirement C7).<br>
This conflict was allowed to stand in Consensus 113-C16 back in 2007,<br>
pending further study.<br></blockquote><div><br></div><div>Would you mind providing the information that you have already collected? Such as the script property values for these characters, and what that 2007 consensus says and what it was based on; and which value you think we should change to what other value.</div><div><br></div><div>Thanks,</div><div>markus</div></div></div>