Beiträge von wahsi

    Hi,


    das erklärt einiges, danke für die Infos.


    Bei RTL passiert aber dann nochwas seltsames, weil wir uns mit dem Programm, dass den Dump erzeugt hat den ich angegeben hatte, an den Standard halten.
    Deshalb müsste das eigentlich anders aussehen.


    Ich sehe mir das nochmal genauer an und melde mich dann nochmal.



    Gruß,


    C.

    Hallo allerseits.


    Ich hab' mich mal auf bitten eines Betroffenen hier angemeldet um mit zu helfen das in den Griff zu bekommen.
    Von mir ist auch der Beitrag im tvdigital Forum bezüglich der CPs.


    Der Beitrag von Ghost ist schon recht nah dran... Allerdings gibt es da noch tiefer gehende Probleme, nämlich dass die meisten Provider zum Erzeugen der Roh-EPG Daten irgendwelche Windows-basierte Software benutzen, und damit fängt der Ärger richtig an - weil Windows nunmal nicht UTF-8 kann. :thumbs_down:


    Wie Ghost schon sagte, halten sich einige EPG Provider nicht an den Standard - oder sie verstehen ihn einfach nicht (man mag es kaum glauben, aber was soll ich euch sagen...) :astonished_face:
    Das führt zu den derzeitig diskutierten Effekten.
    Ghost, es ist in der Tat so, dass Enigma diese Funktionen kann - mein Beitrag im anderen Forum war nicht als Kritik daran gemeint, dass das nicht ginge... Entschuldige mich wenn das so verstanden wurde.


    Nochmal zum Problem:


    Die Sender sollen lt Standard eine Codepage angeben für jedes Event Feld, und zwar mittels erster Ziffer im Text die < 0x20 sein muss, wobei man sich am besten auf <0x0B beschränken sollte, da die restlichen erst später implementiert wurden. Ist sicherer dass es auch überall klappt.


    Im aktuellen Fall gibt RTL für die SI events einfach mal keine CP an:


    table_id = 0x50
    section_syntax_indicator = 1
    section_length = 589
    service_id = 12020
    version_number = 24
    current_next_indicator = 1
    section_number = 48
    last_section_number = 248
    transport_stream_id = 1089
    original_network_id = 1
    segment_last_section_number = 48
    last_table_id = 0x51
    Events [1]...
    event_id = 39087
    start_time = 55783 (MJD) [GMT: WED 10.AUG 2011 18:14:00]
    duration = 153856 [02:59:00 hh:mm:ss]
    running_status = Status #0x00
    free_CA_mode = 0 [free to air]
    descriptor_loop_length = 562
    Event-Descriptors [4]...
    Descriptor Type = short_event_descriptor, descriptor_tag: 0x4D
    ISO_639_language_code = 0x676572 [ger]
    event_name_length = 44
    event_name = Der groûe deutsche Love & Sex-Test by RTL II
    text_length = 0
    text =
    Descriptor Type = extended_event_descriptor, descriptor_tag: 0x4E
    descriptor_number = 0
    last_descriptor_number = 1
    ISO_639_language_code = 0x676572 [ger]
    length_of_items = 0
    text_length = 249
    text = «codepage 05»Der große deutsche Love & Sex-Test by RTL II. Können Spermien riechen? Was bewirkt die "Spanische
    Fliege"? Und: Ziehen sich Gegensätze wirklich an? Sex spielt in unserem Leben eine entscheidende Rolle. Doch wie viel wissen wir
    wirklich über Liebe, [Der große deutsche Love & Sex-Test by RTL II. Können Spermien riechen? Was bewirkt die "Spanische Fliege"?
    Und: Ziehen sich Gegensätze wirklich an? Sex spielt in unserem Leben eine entscheidende Rolle. Doch wie viel wissen wir wirklich über
    Liebe, ]
    Descriptor Type = extended_event_descriptor, descriptor_tag: 0x4E
    descriptor_number = 1
    last_descriptor_number = 1
    ISO_639_language_code = 0x676572 [ger]
    length_of_items = 0
    text_length = 242
    text = «codepage 05»Lust und Leidenschaft? Bei RTL II kann nun jeder testen, wie aufgeklärt er ist. Prominente wie Dirk Bach
    und Dolly Buster stellen sich ebenso den knifflig-pikanten Fragen von Moderatorin Sonja Zietlow wie das Publikum im Studio. Auch die
    ... [Lust und Leidenschaft? Bei RTL II kann nun jeder testen, wie aufgeklärt er ist. Prominente wie Dirk Bach und Dolly Buster
    stellen sich ebenso den knifflig-pikanten Fragen von Moderatorin Sonja Zietlow wie das Publikum im Studio. Auch die ...]
    Descriptor Type = content_descriptor, descriptor_tag: 0x54
    content_level_1_nibble = 3 [Show/Game Show]
    content_level_2_nibble = 0
    user_level_1_nibble = 0
    user_level_2_nibble = 0
    CRC_32 = 0x04E9AD8F



    Wie man sehen kann, gibt's keinen Codepage-Indikator beim Short_Event_Descriptor... Im Gegensatz zum extended_event_descriptor... (das Zeichen wird im Dump automatisch in einen lesbaren String umgewandelt weil Windows die Control-Codes nicht darstellen kann...)


    Wenn man sich aber nun die short_event_decsriptors mal über Zeit anschaut, dann sieht man dass Umlaute dargestellt werden, nur eben ß nicht.
    Statt ß bekommt man û. Nun fanden wir dass û in CP 5 dem ß in CP 0 entspricht. Und das ist seltsam. Denn zunächst dachten wir dass RTL CP 0 benutzt, viele Receiver aber bei fehlender Angabe der CP einfach CP 5 wählen, die normal wäre für unsere Breiten. Man scheint aber etwas anderes zu machen. Denn CP 0 kann keine Umlaute außer ß.


    Seltsam ist das.


    Was macht Engima wenn keine CP angegeben wird? Nutzt es dann wie im Standard vorgesehen die CP 0?
    Denn dann dürfte es doch keine Umlaute geben...


    Das würde bedeuten, dass schon die Codierung des Textes keiner eindeutigen Codepage zuweisbar wäre...?


    Ideen?



    Gruß,


    C.