<p><span style="font-size:18px;">Erik Carvalhal Miller wrote as follows.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">> The tag characters being default ignorable, I would expect a single</span><br><span style="font-size:18px;">missing‐glyph glyph (representing the private‐use code point) to be more</span><br><span style="font-size:18px;">likely, though your mileage may vary.   Here, for example, is a sequence</span><br><span style="font-size:18px;">containing 15 tag characters between a private‐use base and the CANCEL TAG:</span><br><span style="font-size:18px;">⟨􏿽󠁔󠁨󠁩󠁳󠀠󠁩󠁳󠀠󠁡󠀠󠁴󠁥󠁳󠁴󠀮󠁿⟩</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">Thank you for posting the example.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">In the Unicode mailing list archive and in the webmail that I use the display was of the mathematical brackets with one glyph that indicates a missing glyph between them.</span></p><p><span style="font-size:18px;">When I copied the example onto the clipboard and then pasted into WordPad, the display was of the mathematical brackets with seventeen of the glyphs that each indicate a missing glyph between the mathematical brackets.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">I saved from WordPad using the Save as feature to save in the file format that WordPad names as a Unicode Text Document, which is a UTF-16 format file with a BYTE ORDER MARK that indicates, in this particular file, that the low byte is stored before the high byte. I used tags.txt as the file name.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">I then opened the tags.txt file in the ViewHex.exe program that Erwin Denissen had kindly posted in 2009.</span></p><p><span style="font-size:18px;"> </span></p><p><a target="_blank" rel="noopener noreferrer" href="https://forum.high-logic.com/viewtopic.php?p=10579#p10579"><span style="font-size:18px;">https://forum.high-logic.com/viewtopic.php?p=10579#p10579</span></a></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">From there I can note that the fifteen tag character message is as follows.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">This is a test.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">I used the Edit Search... facility of the FontCreator program to find that the base character used is as follows.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">U+10FFFD</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">A good choice, at the top of the map, so maybe it can be thought of as NORTH STAR</span></p><p> </p><p><span style="font-size:18px;">There was a famous early steam locomotive named NORTH STAR so one may, if one so chooses, think of the NORTH STAR locomotive hauling a train of tag characters with the CANCEL TAG as a brake van at the end of the train.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">https://en.wikipedia.org/wiki/GWR_Star_Class</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">An OpenType font used in an OpenType-aware application program can be used to decode the base character and the sequence of tag characters.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">I tried the technique when the QID emoji proposal was being considered and the technique worked well.</span></p><p><span style="font-size:18px;"> </span></p><p><a target="_blank" rel="noopener noreferrer" href="https://forum.high-logic.com/viewtopic.php?p=39337"><span style="font-size:18px;">https://forum.high-logic.com/viewtopic.php?p=39337</span></a></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">The technique can be compared and contrasted with the use of a direct Private Use Area encoding for a character that one has designed.</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">A direct Private Use Area encoding is easier to use, a tag sequence encoding provides scope for a greater chance of a unique encoding assisting unambiguous interoperability and archiving.</span></p><p><span style="font-size:18px;">    </span></p><p><span style="font-size:18px;">William Overington</span></p><p><span style="font-size:18px;"> </span></p><p><span style="font-size:18px;">Saturday 27 April 2024</span></p><p> </p><p> </p>