<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Le ven. 16 mai 2025 à 11:33, Nitai Sasson via Unicode <<a href="mailto:unicode@corp.unicode.org" target="_blank">unicode@corp.unicode.org</a>> a écrit :</div><div dir="ltr"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">I'm making heavy use of Unicode Utilities: <a href="https://util.unicode.org/UnicodeJsps/" rel="noreferrer" target="_blank">https://util.unicode.org/UnicodeJsps/</a><br>
<br>
I've encountered some issues, annoyances and nitpicks with these utilities that I hope can be addressed. Are they open-source?</blockquote><div>Yes, at <a href="https://github.com/unicode-org/unicodetools" target="_blank">https://github.com/unicode-org/unicodetools</a>.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">If so, I might even contribute these improvements myself.<br></blockquote><div>I wouldn’t recommend that.</div><div>These online utilities are deeply coupled with tooling and libraries used to produce the Standard itself (for good reason: their primary goal is to assist in maintenance of the Standard), some of which dates back to the 90s, and whose performance is often highly suboptimal.</div><div>The documentation is mostly in the form of oral tradition, things that look easy generally are not, and things that look innocuous can be so slow that ill-behaved crawlers will bring down the servers.</div><div>And the maintainers don’t really have the time to carefully review changes made by people unfamiliar with the codebase.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">1. Clicking on a property name leads nowhere, presumably after a website restructure. It links to e.g. <a href="https://util.unicode.org/UnicodeJsps/properties.jsp?a=Bidi_Class#Bidi_Class" rel="noreferrer" target="_blank">https://util.unicode.org/UnicodeJsps/properties.jsp?a=Bidi_Class#Bidi_Class</a> but this does not show anything related to this property.<br></blockquote><div>Yes, this page was intentionally blanked, it was one of those that were so slow as to bring down the servers. I should put something back there at some point (though probably not exactly what used to be there; with the expansion of the scope of the tools, that page had become somewhat unusable regardless of performance concerns).</div><div><br></div><div>I’ll remove the links for now, links to a blank page aren’t really helpful…</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
2. Clicking on a property value that contains a single character (e.g. ")" for Bidi_Mirroring_Glyph) should open that character in the Character Properties utility, not the set of characters that share this property value (which is often just the character we came from). Or perhaps there could be a separate "inspect this character" button, so existing behavior remains the same.</blockquote><div>Yes, I should do something about that, it has annoyed me repeatedly.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
3. Missing values (null) should also be clickable to see all character which do not have a value for that property.</blockquote><div>Sure, might as well.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
1. As just alluded, I could not find a way to find characters that don't have a property. For example, I want to find all characters with Bidi_Mirrored=Yes but without any value for Bidi_Mirroring_Glyph. Best I can tell, this is a missing feature.</blockquote><div><a href="https://util.unicode.org/UnicodeJsps/list-unicodeset.jsp?a=%5B%20%5Cp%7BBidi_Mirrored%7D+%26+%5Cp%7BBidi_Mirroring_Glyph%3D%40none%40%7D%20%5D&g=&i=" target="_blank">[ \p{Bidi_Mirrored} & \p{Bidi_Mirroring_Glyph=@none@} ]</a>.</div><div><br></div><div>Unicode Set notation, especially with its extensions used in maintenance of the standard, has long been under-documented, but at its latest meeting in April the UTC has decided to address this issue by <a href="https://www.unicode.org/L2/L2025/25085.htm#183-C26" target="_blank">authorizing</a> a Proposed Draft Unicode Technical Standard #61, Unicode Set Notation.</div><div><br></div><div>On the @none@ syntax see <a href="https://unicode.org/reports/tr61/#property-comparison" target="_blank">https://unicode.org/reports/tr61/#property-comparison</a>, <a href="https://unicode.org/reports/tr61/#Property-Comparisons" target="_blank">https://unicode.org/reports/tr61/#Property-Comparisons</a>, and <a href="https://unicode.org/reports/tr61/#Identity-and-Null-Queries" target="_blank">https://unicode.org/reports/tr61/#Identity-and-Null-Queries</a>.</div><div>The review notes in that draft state that the online tools don’t support some things; this was true when that draft was written, but in most cases this has since been corrected.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">3. Similarly, all links to "bidi" from elsewhere in the Unicode website should link to "bidi-c" instead. In particular: <a href="https://www.unicode.org/reports/tr41/tr41-34.html#Demo9" rel="noreferrer" target="_blank">https://www.unicode.org/reports/tr41/tr41-34.html#Demo9</a></blockquote><div>Good catch, I’ll point that out to the editor of UAX #41.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
4. Bidi mirroring is not displayed [but it should be].<br></blockquote><div>That seems doable.</div><div><br></div><div>Best regards,</div><div><br></div><div>Robin Leroy</div></div></div>
</div>
</div>
</div>
</div>
</div>
</div>