Verwendung von HRDF Fahrplänen zusammen mit GTFS-RT

Kurzbeschreibung

Die Verwendung von GTFS-RT geht davon aus, dass als Basis eine statische GTFS-Datei verwendet wird.

Die Open Data Plattform stellt ein solches zur Verfügung.

Viele Akteure bevorzugen aber das (mächtigere) HRDF-Format.

Fachliche Beschreibung

Im HRDF bilden die folgenden Felder einer Fahrt einen eindeutigen Schlüssel:

  • „Fahrtnummer“
  • „Verwaltung“
  • „Variante“

Diese findet sich in der „*Z-Zeile“ der Datei „FPLAN“.

Im GTFS (und GTFS-RT) ist dies die „Trip_ID“ in der Datei „trips.txt“. Die Routen (in „routes.txt“) und trips werden automatisch nummeriert. D.h. sie sind auch zwischen GTFS-Versionen nicht stabil.

Wenn der eigentliche Fahrplan aus HRDF stammen soll und ihre Algorithmen darauf ausgelegt sind, so müssen sie dennoch das GTFS Static in ihre Datenbank importieren und ein Matching erzeugen.

Technische Beschreibung

Es wird folgendes Vorgehen empfohlen.

Importieren Sie das aktuelle GTFS Static in Ihre Datenbank

Importieren Sie das aktuelle GTFS Static in eine Datenbank (z.B. mit https://github.com/cbick/gtfs_SQL_importer). Als Beispiel ein einfaches SQL-Skript

drop table GTFS_agency;
drop table GTFS_calendar;
drop table GTFS_calendar_dates;
drop table GTFS_routes;
drop table GTFS_stops;
drop table GTFS_stop_times;
drop table GTFS_trips;


create table GTFS_agency(agency_id TEXT,agency_name TEXT,agency_url TEXT,
                    agency_timezone TEXT,agency_lang TEXT, agency_phone TEXT);
create table GTFS_calendar(service_id TEXT,monday NUMERIC, tuesday NUMERIC, wednesday NUMERIC, thursday NUMERIC, friday NUMERIC, saturday NUMERIC, sunday NUMERIC,start_date NUMERIC,end_date NUMERIC);
create table GTFS_calendar_dates(service_id TEXT,date NUMERIC,exception_type NUMERIC);
create table GTFS_routes(route_id TEXT,agency_id TEXT,route_short_name TEXT,
                    route_long_name TEXT,route_type NUMERIC
                    );
-- create table shapes(shape_id TEXT,shape_pt_lat REAL,shape_pt_lon REAL, shape_pt_sequence NUMERIC);
create table GTFS_stops(stop_id TEXT,stop_name TEXT,
                   stop_lat REAL,stop_lon REAL, location_type TEXT,parent_station TEXT
                   );
create table GTFS_stop_times(trip_id TEXT,arrival_time TEXT,departure_time TEXT,
                        stop_id TEXT,stop_sequence NUMERIC,
                        pickup_type NUMERIC,drop_off_type NUMERIC);
create table GTFS_trips(route_id TEXT,service_id TEXT,trip_id TEXT,
                   trip_headsign TEXT,direction_id NUMERIC
                   );
.separator ','
.import GTFS_Import/agency.txt GTFS_agency
.import GTFS_Import/calendar.txt GTFS_calendar
.import GTFS_Import/calendar_dates.txt GTFS_calendar_dates
.import GTFS_Import/routes.txt GTFS_routes
-- .import GTFS_Import/shapes.txt shapes
.import GTFS_Import/stops.txt GTFS_stops
.import GTFS_Import/stop_times.txt GTFS_stop_times
.import GTFS_Import/trips.txt GTFS_trips
delete from GTFS_agency where agency_id like 'agency_id';
delete from GTFS_calendar_dates where service_id like 'service_id';
delete from GTFS_routes where route_id like 'route_id';
-- delete from shapes where shape_id like 'shape_id';
delete from GTFS_stops where stop_id like 'stop_id';
delete from GTFS_stop_times where trip_id like 'trip_id';
delete from GTFS_trips where route_id like 'route_id';

Ein Verständnis der Struktur von GTFS ist notwendig: https://developers.google.com/transit/gtfs/reference/

Importieren Sie die notwendigen Daten aus dem HRDF in eine Datenbank

Sie müssen aus verschiedenen Dateien des HRDF Daten importieren. Die Struktur ist hier beschrieben: https://opentransportdata.swiss/wp-content/uploads/2016/10/hrdf.pdf

Aus „FPLAN“:

*Z Zeile
1-2 *Z
4-8 INT32 Fahrtnummer
10-15 CHAR Verwaltung
19-21 INT16 Variante

* G Zeile
1-2 *G
4-6 CHAR Verkehrsmittel bzw. Gattung
8-14 INT32 optional Haltestelle, ab der die Gattung gilt
16-22 INT32 optional Haltestellennummer, bis zu der die Gattung gilt
24-29 INT32 optional Abfahrtszeitpunkt
31-36 INT32 optional Ankunftszeitpunkt

* L Zeile
1-2 *L
4-11 CHAR Liniennummer

*I Zeilen
1-2 *I
4-5 Z0 ursprünglicher >Zug
4-5 ZN 
30-36 Infotextnummer
* R Zeile
1-2 *R
4-4 CHAR Richtungskennung

* Laufwegzeilen
1-7 Haltestellenummer
30-35 -INT32 Ankunftszeit an der Haltestelle
37-42 INT32 Abfahrts ab Haltestelle
*/

Die Verkehrsperioden müssen auch integriert werden (Datei „BITFELD“). Sie brauchen diese, um die Verkehrstage zu ermitteln.

Aus der Datei „INFOTEXT“ wird benötigt, um bei Ausfällen die korrekte Zugnummer zu identifzieren. Wenn die Zugnummer wechselt (bei Ausfällen), so wird in „INFOTEXT“ im Feld „Infotext“ die ursprüngliche Zugnummer abgelegt. D.h. der Wert von „Z0“ im HRDF muss noch korrekt referenziert werden.

Die Durchbindungen müssen auch importiert werden. Durchbindungen sind zwei Fahrten, die durch denselben Zug durchgeführt werden. Die Durchbindungen sind in der Datei „DURCHBI“ enthalten:

10480 000881 8587086 10481 000881 000000 8587086    % 
10486 000881 8587086 10487 000881 000000 8587086    % 
10502 000801 8507867 10501 000801 000000 8507867    % Unterseen, Spital Interlaken
10502 000801 8507867 90501 000801 000000 8507867    % Unterseen, Spital Interlaken
10504 000801 8507867 10503 000801 000000 8507867    % Unterseen, Spital Interlaken
10504 000801 8507867 90505 000801 000000 8507867    % Unterseen, Spital Interlaken
10510 000801 8507867 10509 000801 000000 8507867    % Unterseen, Spital Interlaken
10512 000801 8507867 10511 000801 000000 8507867    % Unterseen, Spital Interlaken
10514 000801 8507867 10513 000801 000000 8507867    % Unterseen, Spital Interlaken
10516 000801 8507867 10515 000801 000000 8507867    % Unterseen, Spital Interlaken
10518 000801 8507867 10517 000801 000000 8507867    % Unterseen, Spital Interlaken
10520 000037 8500063 10528 000037 000525 8500063    %  00063 50505T R 50505T R 25:28 - 25:28  25:28 - 25:28
10520 000801 8507867 10519 000801 000000 8507867    % Unterseen, Spital Interlaken
10522 000773 8594188 07059 000773 000000 8594188    % 
10522 000801 8507867 10521 000801 000000 8507867    % Unterseen, Spital Interlaken
10523 000773 8594188 04839 000773 000000 8594188    % 
10524 000801 8507867 10523 000801 000000 8507867    % Unterseen, Spital Interlaken
10526 000773 8590892 10418 000773 000000 8590892    % 
10526 000801 8507867 10525 000801 000000 8507867    % Unterseen, Spital Interlaken
10528 000801 8507867 10527 000801 000000 8507867    % Unterseen, Spital Interlaken
10530 000801 8507867 10529 000801 000000 8507867    % Unterseen, Spital Interlaken
10532 000801 8507867 10531 000801 000000 8507867    % Unterseen, Spital Interlaken
10534 000801 8507867 10533 000801 000000 8507867    % Unterseen, Spital Interlaken
10536 000801 8507867 10535 000801 000000 8507867    % Unterseen, Spital Interlaken
10538 000801 8507867 10537 000801 000000 8507867    % Unterseen, Spital Interlaken
10540 000801 8507867 10539 000801 000000 8507867    % Unterseen, Spital Interlaken
10542 000801 8507867 10541 000801 000000 8507867    % Unterseen, Spital Interlaken
10544 000801 8507867 10543 000801 000000 8507867    % Unterseen, Spital Interlaken
10548 000801 8507867 10549 000801 000000 8507867    % Unterseen, Spital Interlaken
10550 000801 8507867 10551 000801 000000 8507867    % Unterseen, Spital Interlaken
10552 000801 8507867 10553 000801 000000 8507867    % Unterseen, Spital Interlaken
10554 000801 8507867 10555 000801 000000 8507867    % Unterseen, Spital Interlaken
10560 000801 8507867 10559 000801 000000 8507867    % Unterseen, Spital Interlaken
10562 000801 8507867 10561 000801 000000 8507867    % Unterseen, Spital Interlaken
10605 000841 8588626 28023 000841 000000 8588626    %  88626 60110E R 60528E R 07:03 - 07:06  07:04 - 07:15
10607 000841 8588626 28033 000841 000000 8588626    %  88626 60110E R 60528E R 08:03 - 08:06  08:04 - 08:15
10625 000841 8588626 28123 000841 000010 8588626    %  88626 60110E R 60528E R 17:12 - 17:15  17:13 - 17:15
10627 000841 8588626 28133 000841 000010 8588626    %  88626 60110E R 60528E R 18:12 - 18:15  18:13 - 18:15
10629 000841 8588626 28143 000841 000010 8588626    %  88626 60110E R 60528E R 19:12 - 19:15  19:13 - 19:15
10653 03____ 8015187 10357 03____ 090720 8015187    %

Im GTFS sind die Durchbindungen bereits zusammengehängt, um den Trip zu bilden. Also Trip A und Trip B, die im HRDF über DURCHBI verbunden sind, sind im GTFS bereits als A->B drin.
Im Minimum sollten im Record enthalten sein:

  • Fahrtnummer
  • Verwaltung
  • Variante
  • Startort
  • Zielort
  • Startzeit
  • Zielzeit
  • Linie
  • Richtung
  • Verkehrsperiode
  • Z0
  • ZN

Matching der Daten

Sie können jetzt die Records matchen über:

  • Startort
  • Startzeit
  • Zielort
  • Zielzeit
  • Richtung
  • Verkehrstag

 

Es ist auch ein Matching über den Laufweg möglich, dann kann auf den Verkehrstag verzichtet werden. Beim Matching über den Laufweg wird die genaue Strecke gematcht.

Beachten Sie:

  • Es gibt mehr Trips in GTFS als Fahrten in HRDF.
  • Grenzüberschreitende Züge werden am Grenzbahnhof trunkiert auf der Opendata-Plattform. Wenn Sie die Fahrpläne aus einer anderen Quelle haben, so kann dies anders sein.
  • Sie können Startort/Zielort auch aus dem Laufweg von „FPLAN“ ermitteln.

 

Das Matching kann statisch oder dynamisch erfolgen, je nachdem, was Ihre Anwendung braucht.  Sie müssen aber auf jeden Fall den relevanten Tag einbeziehen, da sie den entsprechenden Trip und den entsprechenden HRDF-FPLAN-Eintrag nur so eindeutig identifizieren können. Beispielsweise:

  • Sie können dies z.B. mit einer Funktion getTripfromHRDF (FahrtID, Verwaltung, Version , Betriebstag) durchführen.
  • Sie können eine Funktion getHRDFfromTrip(trip_id, Betriebstag) erstellen.
  • Sie erstellen für jeden Betriebstag eine View/Tabelle der Trips und ihrem Mapping zum HRDF (Achtung: Im ungünstigsten Fall 130‘000 Fahrten x 400 Tage)