Hallo allerseits.
Ich hab' mich mal auf bitten eines Betroffenen hier angemeldet um mit zu helfen das in den Griff zu bekommen.
Von mir ist auch der Beitrag im tvdigital Forum bezüglich der CPs.
Der Beitrag von Ghost ist schon recht nah dran... Allerdings gibt es da noch tiefer gehende Probleme, nämlich dass die meisten Provider zum Erzeugen der Roh-EPG Daten irgendwelche Windows-basierte Software benutzen, und damit fängt der Ärger richtig an - weil Windows nunmal nicht UTF-8 kann.
Wie Ghost schon sagte, halten sich einige EPG Provider nicht an den Standard - oder sie verstehen ihn einfach nicht (man mag es kaum glauben, aber was soll ich euch sagen...)
Das führt zu den derzeitig diskutierten Effekten.
Ghost, es ist in der Tat so, dass Enigma diese Funktionen kann - mein Beitrag im anderen Forum war nicht als Kritik daran gemeint, dass das nicht ginge... Entschuldige mich wenn das so verstanden wurde.
Nochmal zum Problem:
Die Sender sollen lt Standard eine Codepage angeben für jedes Event Feld, und zwar mittels erster Ziffer im Text die < 0x20 sein muss, wobei man sich am besten auf <0x0B beschränken sollte, da die restlichen erst später implementiert wurden. Ist sicherer dass es auch überall klappt.
Im aktuellen Fall gibt RTL für die SI events einfach mal keine CP an:
table_id = 0x50
section_syntax_indicator = 1
section_length = 589
service_id = 12020
version_number = 24
current_next_indicator = 1
section_number = 48
last_section_number = 248
transport_stream_id = 1089
original_network_id = 1
segment_last_section_number = 48
last_table_id = 0x51
Events [1]...
event_id = 39087
start_time = 55783 (MJD) [GMT: WED 10.AUG 2011 18:14:00]
duration = 153856 [02:59:00 hh:mm:ss]
running_status = Status #0x00
free_CA_mode = 0 [free to air]
descriptor_loop_length = 562
Event-Descriptors [4]...
Descriptor Type = short_event_descriptor, descriptor_tag: 0x4D
ISO_639_language_code = 0x676572 [ger]
event_name_length = 44
event_name = Der groûe deutsche Love & Sex-Test by RTL II
text_length = 0
text =
Descriptor Type = extended_event_descriptor, descriptor_tag: 0x4E
descriptor_number = 0
last_descriptor_number = 1
ISO_639_language_code = 0x676572 [ger]
length_of_items = 0
text_length = 249
text = «codepage 05»Der große deutsche Love & Sex-Test by RTL II. Können Spermien riechen? Was bewirkt die "Spanische
Fliege"? Und: Ziehen sich Gegensätze wirklich an? Sex spielt in unserem Leben eine entscheidende Rolle. Doch wie viel wissen wir
wirklich über Liebe, [Der große deutsche Love & Sex-Test by RTL II. Können Spermien riechen? Was bewirkt die "Spanische Fliege"?
Und: Ziehen sich Gegensätze wirklich an? Sex spielt in unserem Leben eine entscheidende Rolle. Doch wie viel wissen wir wirklich über
Liebe, ]
Descriptor Type = extended_event_descriptor, descriptor_tag: 0x4E
descriptor_number = 1
last_descriptor_number = 1
ISO_639_language_code = 0x676572 [ger]
length_of_items = 0
text_length = 242
text = «codepage 05»Lust und Leidenschaft? Bei RTL II kann nun jeder testen, wie aufgeklärt er ist. Prominente wie Dirk Bach
und Dolly Buster stellen sich ebenso den knifflig-pikanten Fragen von Moderatorin Sonja Zietlow wie das Publikum im Studio. Auch die
... [Lust und Leidenschaft? Bei RTL II kann nun jeder testen, wie aufgeklärt er ist. Prominente wie Dirk Bach und Dolly Buster
stellen sich ebenso den knifflig-pikanten Fragen von Moderatorin Sonja Zietlow wie das Publikum im Studio. Auch die ...]
Descriptor Type = content_descriptor, descriptor_tag: 0x54
content_level_1_nibble = 3 [Show/Game Show]
content_level_2_nibble = 0
user_level_1_nibble = 0
user_level_2_nibble = 0
CRC_32 = 0x04E9AD8F
Wie man sehen kann, gibt's keinen Codepage-Indikator beim Short_Event_Descriptor... Im Gegensatz zum extended_event_descriptor... (das Zeichen wird im Dump automatisch in einen lesbaren String umgewandelt weil Windows die Control-Codes nicht darstellen kann...)
Wenn man sich aber nun die short_event_decsriptors mal über Zeit anschaut, dann sieht man dass Umlaute dargestellt werden, nur eben ß nicht.
Statt ß bekommt man û. Nun fanden wir dass û in CP 5 dem ß in CP 0 entspricht. Und das ist seltsam. Denn zunächst dachten wir dass RTL CP 0 benutzt, viele Receiver aber bei fehlender Angabe der CP einfach CP 5 wählen, die normal wäre für unsere Breiten. Man scheint aber etwas anderes zu machen. Denn CP 0 kann keine Umlaute außer ß.
Seltsam ist das.
Was macht Engima wenn keine CP angegeben wird? Nutzt es dann wie im Standard vorgesehen die CP 0?
Denn dann dürfte es doch keine Umlaute geben...
Das würde bedeuten, dass schon die Codierung des Textes keiner eindeutigen Codepage zuweisbar wäre...?
Ideen?
Gruß,
C.