<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><br class=""><div><br class=""><blockquote type="cite" class=""><div class="">4 okt. 2023 kl. 22:58 skrev Rebecca Bettencourt via Unicode <<a href="mailto:unicode@corp.unicode.org" class="">unicode@corp.unicode.org</a>>:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class="">The alignment of quotation marks in a CJK square is an issue affecting very few characters, with no easy mechanism in markup or rich text formatting, with precedent in the form of SVSes for other punctuation marks used in CJK text.<div class=""><br class=""></div><div class="">Italics applies to a large, open-ended set of characters (possibly the entire Unicode character set), has been implemented in just about every form of markup and formatting ever conceived, and has no precedent of implementation using VSes (other than the use of VS15/VS16 for text vs emoji presentation, which even the UTC has determined was a mistake).<br clear="all" class=""></div></div></div></blockquote><div><br class=""></div><div>I have missed that (busy with other things)… But I do <i class="">not</i> agree that text/emoji variation sequences were a mistake. Indeed it should be extended and systematized.</div><div><br class=""></div><div>However, the proposal in L2023/23212 would be a major mistake to accept. Most of the ’forms’ given are completely different characters, especially those in <i class="">VS2—Vertical—Hans</i> are completely different from the supposed ”base” characters. (That they are used for more or less the same purpose is <i class="">not</i> a reason to coalesce them.) Variation sequences with FE00/FE01 are for (in some sense) minor typographical differences that are essentially indifferent (except if you care about typography). (The rotated hieroglyphs went too far…)</div><div><br class=""></div><div>/Kent K</div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class=""><div class=""><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><br class="">-- Rebecca Bettencourt</div></div><br class=""></div></div><br class=""><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Oct 4, 2023 at 10:58 AM William_J_G Overington via Unicode <<a href="mailto:unicode@corp.unicode.org" class="">unicode@corp.unicode.org</a>> wrote:<br class=""></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">I have been reading the following.<br class="">
<br class="">
<a href="https://www.unicode.org/L2/L2023/23212-quotes-svs-proposal.pdf" rel="noreferrer" target="_blank" class="">https://www.unicode.org/L2/L2023/23212-quotes-svs-proposal.pdf</a><br class="">
<br class="">
I am not an expert on this at all. It looks good and I hope it becomes <br class="">
implemented.<br class="">
<br class="">
What puzzles me though, is that structurally the proposal seems to have <br class="">
much the same encoding philosophy as a suggestion proposed by me in that <br class="">
they both would allow a variation selector to be used so as to conserve <br class="">
in plain text information that is typically these days conserved in rich <br class="">
text and gets lost if plain text is used. In my proposal, using a <br class="">
variation selector to conserve in a plain text document information <br class="">
about the use of italics in some text.<br class="">
<br class="">
My proposal was rejected, quite strongly.<br class="">
<br class="">
So, deep down, what please is the Unicode encoding philosophy that <br class="">
allows variation selectors to be used to conserve some information, yet <br class="">
not other information, in plain text?<br class="">
<br class="">
William Overington<br class="">
<br class="">
Wednesday 4 October 2023<br class="">
<br class="">
</blockquote></div>
</div></blockquote></div><br class=""></body></html>