<html><head></head><body><div style="font-family: Verdana;font-size: 12.0px;"><div>You cannot just map <sup>2</sup> to SUPERSCRIPT TWO, because you may have cases with nested <sup> or <sub> like 10<sup>(10<sup>100</sup>)</sup>, which is the representation of a number known as <span class="mw-headline" id="Googolplex">Googolplex, or </span>ρ<sub>CO<sub>2</sub><sub>, which is the <span class="VIiyi" jsaction="mouseup:BR6jm" jsname="jqKxS" lang="en"><span class="JLqJ4b ChMk0b" data-language-for-alternatives="en" data-language-to-translate-into="de" data-phrase-index="0" jsaction="agoMJf:PFBcW;usxOmf:aWLT7;jhKsnd:P7O7bd,F8DmGf;Q4AGo:Gm7gYd,qAKMYb;uFUCPb:pvnm0e,pfE8Hb,PFBcW;f56efd:dJXsye;EnoYf:KNzws,ZJsZZ,JgVSJc;zdMJQc:cCQNKb,ZJsZZ,zchEXc;Ytrrj:JJDvdc;tNR8yc:GeFvjb;oFN6Ye:hij5Wb" jscontroller="Zl5N8" jsdata="uqLsIf;_;$40" jsmodel="SsMkhd" jsname="txFAF"><span jsaction="click:qtZ4nf,GFf3ac,tMZCfe; contextmenu:Nqw7Te,QP7LD; mouseout:Nqw7Te; mouseover:qtZ4nf,c2aHje" jsname="W297wb">percentage</span></span></span> of carbon dioxide in an air sample. Such cases are not and should not be handled by Unicode, because their interpretation requires a stack machine.</div>

<div> </div>

<div>CSS is also no solution, because <sub> and <sub> are semantic tags (like <del>, <strong>, <em> and <kbd>) and not just stylistic ones (like <s>, <b>, <i> or <tt>).</div>

<div> 
<div> 
<div name="quote" style="margin:10px 5px 5px 10px; padding: 10px 0 10px 10px; border-left:2px solid #C3D9E5; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">
<div style="margin:0 0 10px 0;"><b>Gesendet:</b> Montag, 22. März 2021 um 09:53 Uhr<br/>
<b>Von:</b> "Jukka K. Korpela via Unicode" <unicode@unicode.org><br/>
<b>An:</b> "Martin J. Dürst" <duerst@it.aoyama.ac.jp><br/>
<b>Cc:</b> "via Unicode" <unicode@unicode.org><br/>
<b>Betreff:</b> Re: HTML entities</div>

<div name="quoted-content">
<div>
<div>Martin J. Dürst (<a href="mailto:duerst@it.aoyama.ac.jp" onclick="parent.window.location.href='mailto:duerst@it.aoyama.ac.jp'; return false;" target="_blank">duerst@it.aoyama.ac.jp</a>) wrote:</div>

<div class="gmail_quote">
<blockquote class="gmail_quote" style="margin: 0.0px 0.0px 0.0px 0.8ex;border-left: 1.0px solid rgb(204,204,204);padding-left: 1.0ex;">Hello Jukka, others,<br/>
<br/>
On 2021/03/18 17:20, Jukka K. Korpela via Unicode wrote:<br/>
> Tex (<a href="mailto:textexin@xencraft.com" onclick="parent.window.location.href='mailto:textexin@xencraft.com'; return false;" target="_blank">textexin@xencraft.com</a>) wrote:<br/>
<br/>
>> However, you are quoting a doc that has been withdrawn.<br/>
<br/>
> It’s a pity that this well-written and useful document was withdrawn, for<br/>
> reasons I don’t understand.<br/>
<br/>
Here are the main reasons, as far as I understand them. Unicode gets<br/>
updated roughly once a year, and Web technology also changes over time.<br/>
There was not enough manpower to keep the document up to date.<br/>
<br/>
In addition, the document was always a kind of tug-of-war between those<br/>
who pushed for more favorable descriptions of specific Unicode<br/>
characters (such as ⁴ in this discussion) or more favorable descriptions<br/>
of markup-based and style-based solutions (such as <sup></sup>).</blockquote>

<div> </div>

<div>Thank you for the description. These opposite views surely reflected different needs, such as the need to represent data in plain text in some contexts and the need for more structured representation.</div>

<div> </div>

<blockquote class="gmail_quote" style="margin: 0.0px 0.0px 0.0px 0.8ex;border-left: 1.0px solid rgb(204,204,204);padding-left: 1.0ex;">Well, an then somebody else uses 10<sup>3.5</sup> somewhere. How are you<br/>
going to express this so that it doesn't turn into 103.5 in plain text?<br/>
The problem is that there is always a limit somewhere for plain text.</blockquote>

<div> </div>

<div>Well, in the given case, it might help if we had IMPLIED EXPONENTIATION (we don’t; we have IMPLIED TIMES, but it does not help here); at least it would appear in text data to indicate that adjacent digits are not part of the same number.</div>

<blockquote class="gmail_quote" style="margin: 0.0px 0.0px 0.0px 0.8ex;border-left: 1.0px solid rgb(204,204,204);padding-left: 1.0ex;"><br/>
There is also always a limit somewhere for markup and styled rendering,<br/>
but it's in a quite different place.</blockquote>

<div> </div>

<div>Regarding exponents, the limit is currently set by the presence of superscript characters for digits, plus, and minus, and (for some reason), =, (, ), and n. This covers most of the cases where one might consider using superscripts in general texts and in expressing values of quantities.</div>

<div> <br/>
But when you have, say, text that contains the simple expression <i>ax </i>with <i>x</i> as a superscript denoting exponent there is no satisfactory way to represent it in plain text. Using just ax would mean using a wrong expression, and using aˣ (with U+02E3 MODIFIER LETTER SMALL X) would be too tricky. Unicode hasn’t got a repertoire of superscript Latin letters even though they are often used as semantically different from normal letters; it only has some of such letters, apparently meant for special uses only (like phonetic symbols).</div>

<blockquote class="gmail_quote" style="margin: 0.0px 0.0px 0.0px 0.8ex;border-left: 1.0px solid rgb(204,204,204);padding-left: 1.0ex;"><br/>
Out of the box rendering of <sup> and <sub> may be rather crude, but I<br/>
guess it should be possible to do a lot better with some dose of CSS and<br/>
possibly some Web fonts.</blockquote>

<div> </div>

<div>In a sense, it would be straightforward to map, say, <sup>2</sup> to SUPERSCRIPT TWO in the rendering phase, either directly at the character level or via glyph selection when an OpenType font is used. In another sense, it would be complicated, since we hardly want to have <sup>2</sup> rendered substantially different from <sup>x</sup> in style. So the mapping should take place only when the entire document contains only such <sup> elements where are characters have superscript counterparts in Unicode (or at the glyph level).<br/>
<br/>
Jukka </div>
</div>
</div>
</div>
</div>
</div>
</div></div></body></html>