MeetUp – Data Science Bielefeld

13. März 202113. März 2021

Meetup #15 Transparenz, Open Data und Citizen Science

Am 6. Mai 2021 erwarten wir zwei Vorträge bei unserem Data Science Meetup.

Durch die Diesel-Debatte in den letzten Jahren und Diskussionen rund um das Thema Stadt- und Verkehrsentwicklung ist das Thema Feinstaub und Luftqualität in den Fokus der Öffentlichkeit gerückt und ist Gegenstand des ersten Vortrags.

Andreas Czerniak beginnt mit einer Einführung in die Feinstaubproblematik. Er stellt uns die https://sensor.community/ vor, eine Community, die mittlerweile weltweit Daten zur Luftqualität sammelt und interessierten Bastler:innen DIY Anleitungen für den Bau eigener Feinstaub-, Luftqualitäts- und Lärmmessstationen zur Verfügung stellt. Die Daten der Sensor Community stehen als Open Data zur Verfügung. In Bielefeld stehen an verschiedenen Stellen seit 2016 selbstgebaute Sensoren dieser Art und liefern seit dem Messdaten an das Projekt. Die Auswertung dieser Daten aus den letzten Jahren und ein Vergleich mit dem Corona-Jahr 2020 wird vorgestellt.

Andreas hat in seinem Studium die Informatik mit der Physik des Meeres (die Ozeanographie) verbunden und engagiert sich bei Code for Bielefeld.

Der zweite Vortrag schließt sich an den Vortrag aus dem Januar zu Machine Learning on the edge an und wird voraussichtlich eine Quantisierung von YOLOv4 zeigen. Details dazu folgen und werden auf der Meetup-Seite bekannt gegeben.

Anmeldung und Details: https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528224/

17. Juli 2020

Meetup #12: Multi-Object Tracking in Videos // Erfahrungen beim Aufbau eines Data Science Teams

Nach dem Themenabend zur Bildverarbeitung im Mai findet das mittlerweile zwölfte Data Science Meetup wieder als Vortragsabend via Zoom statt. Wir freuen uns auf den Vortrag Scaling Data Science is translating Data Science – Erfahrungen und Herausforderungen beim Aufbau eines AI & Data Science Teams von Dr. Florian Nielsen (Miele) und den Vortrag Multi-Object Tracking auf Basis der Kombination von heuristischen und Deep Learning-Verfahren von Michel Ehmen und Denis Stalz-John (beide codecentric).

Daten sind das neue Öl – der Treibstoff der Digitalisierung und insbesondere von daten-getriebenen Produkten und Services. Der Mehrwert der Verwertung von Daten wird überall proklamiert. Aber wie fange ich an? Wer fängt an? Wie organisiere ich diese Unternehmung? Im ersten Vortrag geht Dr. Florian Nielsen auf die Erfahrungen, Herausforderungen und Lösungsansätze beim Aufbau eines AI & Data Science Teams und die Etablierung in einem familiengeführten Unternehmen ein.

Im zweiten Vortrag reden Michel Ehmen und Denis Stalz-John über Verfahren zum Tracken von Personen in Videos. Im ersten Teil des Vortrags stellt Michel die Ergebnisse seiner Masterarbeit vor, in der er mit verschiedenen Computer Vision Methoden und Deep Learning Verfahren ein möglichst stabiles Personen-Tracking zur Analyse von Fußballspielen entwickelt hat. Unter anderem zeigt er dabei, wie die Koordinaten der Spieler aus einem Video in echte Spielfeldkoordinaten übertragen werden können. Der zweite Teil des Vortrags beschäftigt sich damit, wie das Vorgehen des Personen-Trackings auch zur Messung von Abständen zwischen Personen genutzt werden kann. Diese Technologie kann bei bei der aktuellen Herausforderung der Einhaltung von Abstandsregeln und somit zur Reduktion der Infektionsgefahr durch SARS-CoV-2 eingesetzt werden.

Anmeldung und weitere Infos/Zoom-Link gibt es auf unserer Meetup-Seite:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/267354935/

28. April 2020

Themenabend Image Processing

COVID-19 stellt uns alle vor neue Herausforderungen. Wir planen jetzt nicht nur unsere erste reine Remote-Veranstaltung, sondern probieren dabei wie geplant auch ein neues Format für unser Data Science Meetup aus – der Themenabend: Wir erkunden in mehreren Blöcken das Thema Image Processing. Von prä-CNN-Verfahren bis zu Transfer Learning versuchen wir eine große Bandbreite abzudecken. Dabei werden die öffentlichen Vortragsinhalte parallel in (Jupyter-)Notebooks vorgestellt und miteinander geteilt. So wird jeder Interessierte in die Lage versetzt, die Themen praktisch nachzuvollziehen.

17:00 Vorlauf – Begrüßung
17:30 Themenblock 1: „pre-CNN“, Dr. Michael Thies (CITEC)
18:15 Themenblock 2: „early-stage CNN“, Anton Pfeifer (inIT Lemgo)
19:00 Themenblock 3: „Transfer Learning, model zoo“, Michael Adams (CITEC)
19:45 Diskussionsrunden/Breakout Sessions mit den Referenten

Wir sind an diesem Themenabend Kooperationspartner von Digital in NRW. Die Anmeldung kann über Meetup oder Digital in NRW erfolgen. https://www.digital-in-nrw.de/de/termine-themen/veranstaltungen/webinar-ml-deep-dive-image-processing-webinar-ml-deep-dive-image-processing

Das Webinar erfolgt per ZOOM Videokonferenz. Zur Teilnahme reicht ein Browser oder Smartphone, alle Inhalte werden über Browser zur Verfügung gestellt. Für die praktische Mitarbeit wird ein Google-Account, zur Nutzung der „Jupyter-Notebooks“ benötigt. Die Zugangsdaten zu der Veranstaltung, sowie weitere Informationen, werden im Zuge der Anmeldung verteilt.

2. Oktober 2019

Deep Learning for Improving Computer Vision Tasks and Enabling Automated Processes in Industry

Am 10. Oktober gibt es das nächste Data Science Bielefeld Meetup. Wir erwarten einen Vortrag von André Kochanke und Yannick Franke von Go Reply über zwei Use-Cases aus dem Computer Vision-Bereich. Zum einen wird eine Kombination aus Deep Learning Modellen und verschiedenen Post-Processing Schritten zum Auffinden und Bewerten von Produktionsfehlern vorgestellt. Zum anderen wird ein Ansatz zur automatisierten Erkennung von Versicherungsbetrug durch Manipulationen an Schadensbildern mit Hilfe von ML gezeigt.

Weitere Infos und Anmeldungen:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/

3. Juli 2019

Chatbot bauen und Nachfrage prognostizieren: das nächste Data Science Meetup steht in den Startlöchern

Am 11.7.2019 begrüßen wir um 19 Uhr in der Bürgerwache in Bielefeld gleich zwei Referenten. Zum einen kommt Matthias Ulrich, REWE Digital GmbH, zu uns mit einem Vortrag zum Thema „Distributional regression and model selection for demand forecasting in e-grocery“. Neben seiner Tätigkeit als Product Owner im Bereich Supply Chain Analytics beschäftigt er sich auch in seiner PhD Thesis, die er an der Uni Bielefeld in der Arbeitsgruppe Statistik und Datenanalyse schreibt, mit Prognosemodellen zu Nachfragevorhersagen.

Zum anderen freuen wir uns auf den Vortrag „Von Daten zu Konversationen“ von Dr. Christina Unger (Mercury.AI): „Wir geben einen Einblick in die Chatbot-Plattform von Mercury.ai und zeigen wie man auf der Grundlage von vorhandenen Daten dynamisch Dialog führen kann. Dabei soll es v.a. um Herausforderungen gehen, sowohl bei der Organisation der Daten als auch beim Überbrücken von Unterschieden zwischen Daten und Sprache.“

Anmeldung wie immer auf Meetup.com.

15. April 201915. April 2019

Rückblick Building Interpretable Neural Networks with Keras and LIME

Es gab am 11.4.2019 einen Vortrag von Shirin Glander zu Keras und LIME. Damit wir alle Shirin besser kennenlernen konnten, haben wir (Florian, Philipp und Meike) uns drei Fragen überlegt, die unsere Referenten*innen in Zukunft vor ihrem jeweiligen Vortrag in der Vorstellungsrunde beantworten müssen.

(1) In welchem Kontext hast du das erste Mal mit Daten gearbeitet?

Während des Biologiestudiums beim Laborexperiment. Es hatte etwas mit Mäusen in Gläsern und deren Sauerstoffgehalt zu tun…

(2) Der Data Scient ist ist eine Mischung aus Hacker, Mathe Nerd und Business Mensch: wie sind die Anteile bei dir verteilt?

Durch das Biologiestudium sehe ich bei mir den Hauptanteil im Bereich klassischer Statistik

(3) Dein persönliches Data Fuck Up: welche Frage konntest du nicht mit Daten beantworten?

Ein richtiges Data Fuck Up gab es bis jetzt nicht, eher die Probleme, dass von Kunden Daten kommen, die gemerged werden sollen und nach 3 Tagen wird bemerkt: Ups, falscher Auszug aus der Datenbank…

(Die Antworten stammen aus dem Gedächtnisprotokoll).

Beim Vortrag hat Shirin ein Convolutional Neuronales Netz zur Bilderkennung von Früchten, welches sie mit Keras gebaut hatte, gezeigt. Keras hat sie dabei als Baukastensystem beschrieben, mit dem alle Varianten an Neuronalen Netzen gebaut und geschätzt werden können. Um das Neuronale Netz besser zu verstehen, kam dann im zweiten Schritt LIME zum Einsatz, um herauszufinden, aufgrund welcher Pixel in den Testbildern ein Bild beispielsweise als Banane klassifiziert worden ist. Den Code gibt es zum Nachlesen auf Shirins Blog: (1) Image Classification with Keras und (2) Explaning Keras image classification models with lime. Außerdem auch noch den Link zum empfohlenen Video zur weiteren Erläuterung von LIME.

Diese Informationen plus die Slides findet ihr auch in unserem Git Repository.

We need to make sure that our models are not going to cause harm to people or society.

21. März 201921. März 2019

Upcoming Events 2019

Wir freuen uns auf das nächste Meetup am 11. April 2019 mit Dr. Shirin Glander, Data Scientist codecentric AG. Sie hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. Regelmäßig bloggt sie über Data-Science-Themen (https://www.shirin-glander.de/) und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Und auch die nächsten Termine bis November2019 sind bereits geplant:

9.5.2019 – Code Night #3
11.7.2019 – Meetup #8 Demand forecasting in e-grocery
12.9.2019 – Code Night #4
10.10.2019 – Meetup #9 Machine Learning in the industry
14.11.2019 – Code Night #5

Details sind wie gewohnt auf meetup.com zu finden.

12. Oktober 201812. Oktober 2018

Rückblick und Ausblick – Save the date

SAVE THE DATE:

20. November 2018 18 Uhr, Code Sprint
11. Dezember 2018 18 Uhr, weihnachtliches Treffen auf dem Weihnachtsmarkt Bielefeld (Alter Markt, Lions Glühweinbude)

Bei unserem letzten Treffen am 9.11.2018 am Kesselbrink in der Volksbank Bielefeld-Gütersloh hat uns im ersten Teil Lars Marek einen Vortrag zur Entwicklung von Personas gehalten. Dabei stellte er das Zusammenspiel von quantitativen Methoden (Generierung von Hard Facts) und qualitativen Methoden (Anreicherung mit Soft Facts) sehr gut dar und wie aus diesen Informationen Ableitungen für ein zielgenaues Marketing gemacht werden können. Vielen Dank dafür!

Anschließend haben wir uns in der Gruppe über Formate eines Code Sprints und eines möglichen, gemeinsam zu realisierenden Projekts ausgetauscht. Das Ergebnis war, dass wir uns am 20. November um 18 Uhr treffen möchten, um gemeinsam an einer Wohnlagenkarte für Bielefeld zu arbeiten, um dabei miteinander neue Dinge auszuprobieren und lernen zu können, e.g. R, Python, Geodaten-Verarbeitung, OpenStreetMap-API, Bewertungs-Algorithmus Wohnlage, … Weitere Informationen findet ihr auf der Seite vom Code-Sprint. Für die Organisation des Code-Sprints wird demnächst ein Meetup erstellt.

24. September 20186. November 2019

Next Meetup: Entwicklung von Personas mit quantitativen und qualitativen Methoden

Am 9. Oktober 2018 findet unser nächstes Data Science Meetup Bielefeld statt. Wir treffen uns um 19 Uhr in der Lobby der Volksbank Bielefeld-Gütersloh eG, Kesselbrink 1 in Bielefeld.

Im ersten Teil des Abends wird Lars Marek einen Vortrag zur Entwicklung von Personas mit quantitativen und qualitativen Methoden im Bereich des gesetzlichen Krankenversicherungsmarktes halten. Personas sind Kunden- oder Nutzermodelle, die Personen einer Zielgruppe charakterisieren. Durch Segmentierungs- und Clusteranalyseverfahren lassen sich aus geeigneten Nutzerdaten (neben Stamm- und Transaktionsdaten zählen dazu beispielsweise auch Online-Befragungen oder Interviews) sogenannte Kern- und Randpersonas ermitteln, die Hauptnutzergrupen und Untergruppen repräsentieren.

Ursprünglich wurden Personas im Marketing/Vertrieb eines Unternehmens eingesetzt, um z.B. zielgruppengerecht Neukunden anzuwerben. Das Konzept der Personas kann aber im gesamten Unternehmen eingesetzt werden, um daraus gewonnene Erkenntnisse in neue Produkte, Services und die strategische Ausrichtung eines Unternehmens einfließen zu lassen.

Im zweiten Teil des Abends widmen wir uns wieder einem Code Sprint. Als Inspiration verwenden wir die Wohlagenkarte von Open Data Bielefeld: https://stadtplan.bielefeld.de/app/wohnlagenkarte/
Unser Ziel ist es über mehrere Code Sprints diese Anwendung von Geo- und weiteren Daten auszubauen, hin zu einer Karte mit einer dynamischen „Lebenswert“-Färbung basierend auf Eingaben des Anwenders. Get involved early!

Um vorherige Anmeldung im Data Science Meetup Bielefeld wird gebeten!