<p><span style="font-size:18px;">A glyph of The Welsh Flag is encoded in Unicode as a sequence of a base character followed by some tag characters and a CANCEL TAG.</span></p><p> </p><p><span style="font-size:18px;">As far as I am aware, this is regarded as a plain text encoding. I am not aware of that encoding ever having been referred to as markup.</span></p><p> </p><p><span style="font-size:18px;">U+1F91F is listed in</span></p><p> </p><p><a target="_blank" rel="noopener noreferrer" href="https://www.unicode.org/charts/PDF/U1F900.pdf"><span style="font-size:18px;">https://www.unicode.org/charts/PDF/U1F900.pdf</span></a></p><p> </p><p><span style="font-size:18px;">as</span></p><p> </p><p><span style="font-size:18px;">I LOVE YOU HAND SIGN</span></p><p> </p><p><span style="font-size:18px;">and in the same document,</span></p><p> </p><p><span style="font-size:18px;">U+1F98B is listed as BUTTERFLY</span></p><p> </p><p><span style="font-size:18px;">If those two characters are in a block of text, not necessarily next to each other, and the text is to be transcribed as all alphanumeric text, how should those two characters be transcribed? Or used in a text to speech system? What if the text in the original document is in French, how should those two pictographs be transcribed? Or spoken?</span></p><p> </p><p><span style="font-size:18px;">Please consider an encoding of a glyph that has been designed and assigned a meaning by an artist. (Yes, a hobbyist artist, but artists and novelists are not expected to be representing an organization, so their output is "recognized" rather than being discriminated against.)</span></p><p> </p><p><span style="font-size:18px;">There is such a glyph that has been assigned the following meaning, intended for use in seeking information about relatives and friends after a disaster</span></p><p> </p><p><span style="font-size:18px;">Is there any information about the following person please?</span></p><p> </p><p><span style="font-size:18px;">Suppose that that glyph is encoded as follows.</span></p><p> </p><p><span style="font-size:18px;">U+10FFFD followed by the tag versions of !313125 and a CANCEL TAG.</span></p><p> </p><p><span style="font-size:18px;">Then it seems to me that that is a plain text encoding, based on the precedents of the encoding of the glyph of The Welsh Flag and of the encoding of a glyph with a meaning not obvious from its appearance.</span></p><p> </p><p><span style="font-size:18px;">The glyph is displayed in Chapter 42 of my first novel, on page 2.</span></p><p> </p><p><a target="_blank" rel="noopener noreferrer" href="http://www.users.globalnet.co.uk/~ngo/novel_plus.htm"><span style="font-size:18px;">http://www.users.globalnet.co.uk/~ngo/novel_plus.htm</span></a></p><p> </p><p><span style="font-size:18px;">That novel was completed in 2019 and there have been some developments since then, but the chapter contains lots of symbols that may be of interest as to how indications of the assigned meanings information is packed into the various glyphs.</span></p><p> </p><p><span style="font-size:18px;">The analysis in this post shows that the encoding that I am using for the glyph that I designed is plain text and therefore in principle the encoding could, if the Unicode Technical Committee so decides, be encoded as plain text in The Unicode Standard as a sequence of a base character, some tag characters, and a CANCEL TAG.</span></p><p> </p><p><span style="font-size:18px;">William Overington</span></p><p> </p><p><span style="font-size:18px;">Friday 3 May 2024</span></p><p> </p><p> </p>