Rád bych věděl, jak jsme na tom s ukládáním textových dokumentů a jestli dáváme pozor na to, v jaké znakové sadě si ukládáme textové soubory....
Například v mojí škole je věčný nepořádek ve formátech textových dokumentů. Dokud byl pro BFU jen jeden - .doc - bylo to v pohodě. Do toho lezl jenom .rtf. Jakmile přišly předinstalované MS Office 2007, rozmnožil se .docx a bylo zaděláno. Školní MS Office 2003 (někdy i jen 2000) to díky tomu, že ve škole se aktualizace nedělají, nedokázaly otevřít a učitelům nebylo jak dodat DÚ sbastlené v MS Office 2007. Ještě více to zamotal produkt MS Works, který má vlastní formát pro textové dokumenty a který se také dodává s Win Vista na nových noteboocích.
Byl i jeden exot, který něco dodal i v .odt
Jádro problému ční v tom, že se u nás nikdo při ukládání nekouká na kolonku formát. Tudíž každý to uloží v defaultně nastaveném formátu a dál to neřeší - tedy do chvíle, kdy to na jiném PC neotevře.
Slyšel jsem pouze o jednom případu, že v jedné škole tamější IT technik prosadil, že všechny školní dokumenty budou v .rtf a všechny kantory naučil, jak do tohoto formátu ukládat.
Po dlouhé době jsem zůstal u osvědčené dvojice formát-charset, kterou tvoří HTML a UTF-8 (unicode) - popřípadě UTF-16 (pro extrémisty je tu i UTF-32).
HTML vám otevře každý. Učitelé a spolužáci HTML neumějí, tudíž mi to neupraví hned, jak by se jim zachtělo. Přitom když se to otevře přes "otevřít v programu", otevře se to jak v MS Office, tak v OpenOffice, i když já si to upravuju přes texťák. Řeší se tím i "linuxové" a "windowsové" konce řádků a dokument je přenositelný mezi všemy OS.
Co se týká charsetu. Není mi zrovna po chuti, když narazím na webovou stránku, která je vyrenderována se znakovou sadou windows-1250 a texťák je v ANSI (v tom horším případě) nebo unicode (v tom lepším případě :-) ).
V případě, že nepíšu zdrojáky C, C++, tak nic jiného než UTF-8 (unicode) nepoužívám. Nesnáším sady typu windows-1250 (známý též jako cp-1250 nebo středoevropský-1250). Takovýto nepořádek by na kontinentu, kde se setkávají nejrůznější znakové sady a nejrůznější znaky, neměl být. Pěkně s Brity/Američany v ANSI a po zbytku světa v UTF-8, popřípadě v UTF-16