<div dir="ltr"><div dir="ltr">Le mer. 3 sept. 2025 à 20:10, Henry via Unicode <<a href="mailto:unicode@corp.unicode.org">unicode@corp.unicode.org</a>> a écrit :</div><div class="gmail_quote gmail_quote_container"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div>× 200B ÷ 0308 × 0024 ÷ #  × [0.3] ZERO WIDTH SPACE (ZW_NotEastAsian) ÷ [8.0] COMBINING DIAERESIS (CM1_NotEastAsian_CM) × [24.03] DOLLAR SIGN (PR_NotEastAsian) ÷ [0.3]</div><div><br></div><div>LB24 states "Do not break between alphabetics (“at”)" with the following break rule:</div><div><br></div><div>(PR | PO) × (AL | HL)</div><div>(AL | HL) × (PR | PO)</div><div><br></div><div>However, neither U+200B nor U+0308 has break class PR, PO, AL, or HL (they have break class ZW and CM).</div></div></blockquote><div>You missed rule LB10.</div><div><br></div><div>LB9: Treat X (CM | ZWJ)* as if it were X, where X is any line break class except BK, CR, LF, NL, SP, or ZW.</div><div>LB10: Treat any remaining CM or ZWJ as if it had the properties of U+0041 A LATIN CAPITAL LETTER A, that is, Line_Break=AL, General_Category=Lu, East_Asian_Width=Na, Extended_Pictographic=N.</div><div><br></div><div>U+0208 is CM.</div><div>U+200B is ZW, so LB9 does not apply. Therefore, LB10 applies, and it becomes AL for subsequent rules.</div><div>LB24 therefore applies, (AL | HL) × (PR | PO).</div><div><br></div><div>Same for the other example you cite, a CM becomes AL.</div><div><br></div><div>Best regards,</div><div><br></div><div>Robin Leroy</div></div></div>