<div dir="ltr"><div dir="ltr">I think many people would call that a binary file with an internal structure where the first part is text and the second part is binary.</div><div><br></div>I suspect there is a "magic sequence" of some kind as a separator.<div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Sep 14, 2020 at 12:48 PM Roger L Costello via Unicode <<a href="mailto:unicode@unicode.org">unicode@unicode.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Is there a practical, real-world problem with treating it as a text file?<br></blockquote><div><br></div><div>Depends on what you do. For some stuff, it will "work" or be harmless. In other cases, tools will barf at you because they tried to validate it as, say, UTF-8 text and found errors.</div><div>Or the result may not be useful. What if you count the number of lines of "text" and the tool gives you arbitrary results based on what bytes it happens to find in the binary part?</div><div><br></div><div>Why do you need to give it a single attribute of "text" or "binary"?</div><div>It's a bit like asking about the single language of a text that contains paragraphs in different languages.</div><div><br></div><div>markus</div></div></div></div>