<div dir="ltr">Hi Unicodets<div><br></div><div>   I just updated a web page I once created (now at <<a href="http://twojays.me/unichar-14.0.0.html">http://twojays.me/unichar-14.0.0.html</a>>), which lists the whole Unicode repertoire, including all the decompositions, aliases, cross references and comments. I find this summary page to be the only character reference I need in my day-to-day life. It's as short as I could make it, though if it were printed out, it would be about 1000 pages long(!).</div><div><br></div><div>   But in updating it, I came upon a problem:</div><div><br></div><div>   Some combining characters are clearly "printing characters", for example,</div><div><span style="color:rgb(0,0,0);font-family:serif,"Apple Color Emoji","Noto Music","Noto Sans Anatolian Hieroglyphs","Noto Sans Indic Siyaq Numbers","Noto Sans Math","Noto Sans Old Sogdian","Noto Sans SignWriting","Noto Sans Sogdian","Noto Serif Devanagari","Noto Serif Tangut","Noto Traditional Nushu","Noto Sans Symbols","Noto Sans Symbols 2";font-size:medium"><br></span></div><div> <span style="color:rgb(0,0,0);font-family:serif,"Apple Color Emoji","Noto Music","Noto Sans Anatolian Hieroglyphs","Noto Sans Indic Siyaq Numbers","Noto Sans Math","Noto Sans Old Sogdian","Noto Sans SignWriting","Noto Sans Sogdian","Noto Serif Devanagari","Noto Serif Tangut","Noto Traditional Nushu","Noto Sans Symbols","Noto Sans Symbols 2";font-size:medium"> ́ COMBINING ACUTE ACCENT</span><br></div><div><br clear="all"><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div>which can be shown graphically, as above, by displaying it on a space. Some are control characters, and have no possible visual display, such as</div><div><br></div><div><span style="color:rgb(0,0,0);font-family:serif,"Apple Color Emoji","Noto Music","Noto Sans Anatolian Hieroglyphs","Noto Sans Indic Siyaq Numbers","Noto Sans Math","Noto Sans Old Sogdian","Noto Sans SignWriting","Noto Sans Sogdian","Noto Serif Devanagari","Noto Serif Tangut","Noto Traditional Nushu","Noto Sans Symbols","Noto Sans Symbols 2";font-size:medium"> \u034F COMBINING GRAPHEME JOINER</span><br></div><div><br></div><div>which can only be shown as a code: it has no printable nature at all.</div><div><br></div><div>   Now, in the case of non-combining characters, this distinction is made very clearly, as it has been all the way back to the days of the C isprint() and iscntrl() macros. But for combining characters, the distinction between printable and control seems not to be made. The only way I could see to do was to special-case the character names</div><div><br></div><div>    VARIATION SELECTOR-[0-9]+<br>    MONGOLIAN FREE VARIATION SELECTOR (ONE|TWO|THREE|FOUR)</div><div>    COMBINING GRAPHEME JOINER</div><div>    TIFINAGH CONSONANT JOINER</div><div>    BRAHMI NUMBER JOINER</div><div><br></div><div>which isn't very satisfactory.</div><div><br></div><div>   Am I missing something? And if not, should there be something in UnicodeData.txt that gives me this information?<br></div><div><br></div><div>   I was also wondering idly if anyone has any practical uses for the legacy computing characters, specifically the ones with "BLOCK DIAGONAL" in the name. They look tantalisingly as though they must be good for something, but I don't know what it could be—</div><div dir="ltr"><br></div><div dir="ltr">   Cheers<br><br><span style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px">~</span>Jonathan Coxhead</div><div dir="ltr"><font color="#000000" face="serif, Apple Color Emoji, Noto Music, Noto Sans Anatolian Hieroglyphs, Noto Sans Indic Siyaq Numbers, Noto Sans Math, Noto Sans Old Sogdian, Noto Sans SignWriting, Noto Sans Sogdian, Noto Serif Devanagari, Noto Serif Tangut, Noto Traditional Nushu, Noto Sans Symbols, Noto Sans Symbols 2" size="3"><span style="caret-color: rgb(0, 0, 0);"><br></span></font><div>“<i>ballads not bombs, songs not surveillance</i>” —Thom Hartmann</div><div><br></div></div></div></div></div></div>