Meetup #15 Transparenz, Open Data und Citizen Science

Am 6. Mai 2021 erwarten wir zwei VortrÀge bei unserem Data Science Meetup.

Durch die Diesel-Debatte in den letzten Jahren und Diskussionen rund um das Thema Stadt- und Verkehrsentwicklung ist das Thema Feinstaub und LuftqualitĂ€t in den Fokus der Öffentlichkeit gerĂŒckt und ist Gegenstand des ersten Vortrags.

Andreas Czerniak beginnt mit einer EinfĂŒhrung in die Feinstaubproblematik. Er stellt uns die https://sensor.community/ vor, eine Community, die mittlerweile weltweit Daten zur LuftqualitĂ€t sammelt und interessierten Bastler:innen DIY Anleitungen fĂŒr den Bau eigener Feinstaub-, LuftqualitĂ€ts- und LĂ€rmmessstationen zur VerfĂŒgung stellt. Die Daten der Sensor Community stehen als Open Data zur VerfĂŒgung. In Bielefeld stehen an verschiedenen Stellen seit 2016 selbstgebaute Sensoren dieser Art und liefern seit dem Messdaten an das Projekt. Die Auswertung dieser Daten aus den letzten Jahren und ein Vergleich mit dem Corona-Jahr 2020 wird vorgestellt.

Andreas hat in seinem Studium die Informatik mit der Physik des Meeres (die Ozeanographie)  verbunden und engagiert sich bei Code for Bielefeld.

Der zweite Vortrag schließt sich an den Vortrag aus dem Januar zu Machine Learning on the edge an und wird voraussichtlich eine Quantisierung von YOLOv4 zeigen. Details dazu folgen und werden auf der Meetup-Seite bekannt gegeben.

Anmeldung und Details: https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528224/

Meetup #12: Multi-Object Tracking in Videos // Erfahrungen beim Aufbau eines Data Science Teams

Nach dem Themenabend zur Bildverarbeitung im Mai findet das mittlerweile zwölfte Data Science Meetup wieder als Vortragsabend via Zoom statt. Wir freuen uns auf den Vortrag Scaling Data Science is translating Data Science – Erfahrungen und Herausforderungen beim Aufbau eines AI & Data Science Teams von Dr. Florian Nielsen (Miele) und den Vortrag Multi-Object Tracking auf Basis der Kombination von heuristischen und Deep Learning-Verfahren von Michel Ehmen und Denis Stalz-John (beide codecentric).

Daten sind das neue Öl – der Treibstoff der Digitalisierung und insbesondere von daten-getriebenen Produkten und Services. Der Mehrwert der Verwertung von Daten wird ĂŒberall proklamiert. Aber wie fange ich an? Wer fĂ€ngt an? Wie organisiere ich diese Unternehmung? Im ersten Vortrag geht Dr. Florian Nielsen auf die Erfahrungen, Herausforderungen und LösungsansĂ€tze beim Aufbau eines AI & Data Science Teams und die Etablierung in einem familiengefĂŒhrten Unternehmen ein.


Im zweiten Vortrag reden Michel Ehmen und Denis Stalz-John ĂŒber Verfahren zum Tracken von Personen in Videos. Im ersten Teil des Vortrags stellt Michel die Ergebnisse seiner Masterarbeit vor, in der er mit verschiedenen Computer Vision Methoden und Deep Learning Verfahren ein möglichst stabiles Personen-Tracking zur Analyse von Fußballspielen entwickelt hat. Unter anderem zeigt er dabei, wie die Koordinaten der Spieler aus einem Video in echte Spielfeldkoordinaten ĂŒbertragen werden können. Der zweite Teil des Vortrags beschĂ€ftigt sich damit, wie das Vorgehen des Personen-Trackings auch zur Messung von AbstĂ€nden zwischen Personen genutzt werden kann. Diese Technologie kann bei bei der aktuellen Herausforderung der Einhaltung von Abstandsregeln und somit zur Reduktion der Infektionsgefahr durch SARS-CoV-2 eingesetzt werden.

Anmeldung und weitere Infos/Zoom-Link gibt es auf unserer Meetup-Seite:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/267354935/

Themenabend Image Processing

COVID-19 stellt uns alle vor neue Herausforderungen. Wir planen jetzt nicht nur unsere erste reine Remote-Veranstaltung, sondern probieren dabei wie geplant auch ein neues Format fĂŒr unser Data Science Meetup aus – der Themenabend: Wir erkunden in mehreren Blöcken das Thema Image Processing. Von prĂ€-CNN-Verfahren bis zu Transfer Learning versuchen wir eine große Bandbreite abzudecken. Dabei werden die öffentlichen Vortragsinhalte parallel in (Jupyter-)Notebooks vorgestellt und miteinander geteilt. So wird jeder Interessierte in die Lage versetzt, die Themen praktisch nachzuvollziehen.

17:00 Vorlauf – BegrĂŒĂŸung
17:30 Themenblock 1: „pre-CNN“, Dr. Michael Thies (CITEC)
18:15 Themenblock 2: „early-stage CNN“, Anton Pfeifer (inIT Lemgo)
19:00 Themenblock 3: „Transfer Learning, model zoo“, Michael Adams (CITEC)
19:45 Diskussionsrunden/Breakout Sessions mit den Referenten

Wir sind an diesem Themenabend Kooperationspartner von Digital in NRW. Die Anmeldung kann ĂŒber Meetup oder Digital in NRW erfolgen. https://www.digital-in-nrw.de/de/termine-themen/veranstaltungen/webinar-ml-deep-dive-image-processing-webinar-ml-deep-dive-image-processing

Das Webinar erfolgt per ZOOM Video­kon­fe­renz. Zur Teilnahme reicht ein Browser oder Smart­phone, alle Inhalte werden ĂŒber Browser zur VerfĂŒgung gestellt. FĂŒr die prak­ti­sche Mitarbeit wird ein Google-Account, zur Nutzung der „Jupyter-Notebooks“ benötigt. Die Zugangs­daten zu der Veran­stal­tung, sowie weitere Infor­ma­tionen, werden im Zuge der Anmeldung verteilt.

Deep Learning for Improving Computer Vision Tasks and Enabling Automated Processes in Industry

Am 10. Oktober gibt es das nĂ€chste Data Science Bielefeld Meetup. Wir erwarten einen Vortrag von AndrĂ© Kochanke und Yannick Franke von Go Reply ĂŒber zwei Use-Cases aus dem Computer Vision-Bereich. Zum einen wird eine Kombination aus Deep Learning Modellen und verschiedenen Post-Processing Schritten zum Auffinden und Bewerten von Produktionsfehlern vorgestellt. Zum anderen wird ein Ansatz zur automatisierten Erkennung von Versicherungsbetrug durch Manipulationen an Schadensbildern mit Hilfe von ML gezeigt.

Weitere Infos und Anmeldungen:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/

Chatbot bauen und Nachfrage prognostizieren: das nÀchste Data Science Meetup steht in den Startlöchern

Am 11.7.2019 begrĂŒĂŸen wir um 19 Uhr in der BĂŒrgerwache in Bielefeld gleich zwei Referenten. Zum einen kommt Matthias Ulrich, REWE Digital GmbH, zu uns mit einem Vortrag zum Thema „Distributional regression and model selection for demand forecasting in e-grocery“. Neben seiner TĂ€tigkeit als Product Owner im Bereich Supply Chain Analytics beschĂ€ftigt er sich auch in seiner PhD Thesis, die er an der Uni Bielefeld in der Arbeitsgruppe Statistik und Datenanalyse schreibt, mit Prognosemodellen zu Nachfragevorhersagen.

Zum anderen freuen wir uns auf den Vortrag „Von Daten zu Konversationen“ von Dr. Christina Unger (Mercury.AI): „Wir geben einen Einblick in die Chatbot-Plattform von Mercury.ai und zeigen wie man auf der Grundlage von vorhandenen Daten dynamisch Dialog fĂŒhren kann. Dabei soll es v.a. um Herausforderungen gehen, sowohl bei der Organisation der Daten als auch beim ÜberbrĂŒcken von Unterschieden zwischen Daten und Sprache.“

Anmeldung wie immer auf Meetup.com.

RĂŒckblick Building Interpretable Neural Networks with Keras and LIME

Es gab am 11.4.2019 einen Vortrag von Shirin Glander zu Keras und LIME. Damit wir alle Shirin besser kennenlernen konnten, haben wir (Florian, Philipp und Meike) uns drei Fragen ĂŒberlegt, die unsere Referenten*innen in Zukunft vor ihrem jeweiligen Vortrag in der Vorstellungsrunde beantworten mĂŒssen.

 (1) In welchem Kontext hast du das erste Mal mit Daten gearbeitet?

WĂ€hrend des Biologiestudiums beim Laborexperiment. Es hatte etwas mit MĂ€usen in GlĂ€sern und deren Sauerstoffgehalt zu tun…

 (2) Der Data Scient ist ist eine Mischung aus Hacker, Mathe Nerd und Business Mensch: wie sind die Anteile bei dir verteilt?

Durch das Biologiestudium sehe ich bei mir den Hauptanteil im Bereich klassischer Statistik

 (3) Dein persönliches Data Fuck Up: welche Frage konntest du nicht mit Daten beantworten?

Ein richtiges Data Fuck Up gab es bis jetzt nicht, eher die Probleme, dass von Kunden Daten kommen, die gemerged werden sollen und nach 3 Tagen wird bemerkt: Ups, falscher Auszug aus der Datenbank


(Die Antworten stammen aus dem GedÀchtnisprotokoll).

Beim Vortrag hat Shirin ein Convolutional Neuronales Netz zur Bilderkennung von FrĂŒchten, welches sie mit Keras gebaut hatte, gezeigt. Keras hat sie dabei als Baukastensystem beschrieben, mit dem alle Varianten an Neuronalen Netzen gebaut und geschĂ€tzt werden können. Um das Neuronale Netz besser zu verstehen, kam dann im zweiten Schritt LIME zum Einsatz, um herauszufinden, aufgrund welcher Pixel in den Testbildern ein Bild beispielsweise als Banane klassifiziert worden ist. Den Code gibt es zum Nachlesen auf Shirins Blog: (1)  Image Classification with Keras und (2) Explaning Keras image classification models with lime.  Außerdem auch noch den Link zum empfohlenen Video zur weiteren ErlĂ€uterung von LIME.

Diese Informationen plus die Slides findet ihr auch in unserem Git Repository.

We need to make sure that our models are not going to cause harm to people or society.

Upcoming Events 2019

Wir freuen uns auf das nĂ€chste Meetup am 11. April 2019 mit Dr. Shirin Glander, Data Scientist codecentric AG. Sie hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. RegelmĂ€ĂŸig bloggt sie ĂŒber Data-Science-Themen (https://www.shirin-glander.de/) und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Und auch die nÀchsten Termine bis November2019  sind bereits geplant:

  • 9.5.2019 – Code Night #3
  • 11.7.2019 – Meetup #8 Demand forecasting in e-grocery
  • 12.9.2019 – Code Night #4
  • 10.10.2019 – Meetup #9 Machine Learning in the industry
  • 14.11.2019 – Code Night #5

Details sind wie gewohnt auf meetup.com zu finden.

RĂŒckblick und Ausblick – Save the date

SAVE THE DATE:

  • 20. November 2018 18 Uhr, Code Sprint
  • 11. Dezember 2018 18 Uhr, weihnachtliches Treffen auf dem Weihnachtsmarkt Bielefeld (Alter Markt, Lions GlĂŒhweinbude)

Bei unserem letzten Treffen am 9.11.2018 am Kesselbrink in der Volksbank Bielefeld-GĂŒtersloh hat uns im ersten Teil Lars Marek einen Vortrag zur Entwicklung von Personas gehalten. Dabei stellte er das Zusammenspiel von quantitativen Methoden (Generierung von Hard Facts) und qualitativen Methoden (Anreicherung mit Soft Facts) sehr gut dar und wie aus diesen Informationen Ableitungen fĂŒr ein zielgenaues Marketing gemacht werden können. Vielen Dank dafĂŒr!

Anschließend haben wir uns in der Gruppe ĂŒber Formate eines Code Sprints und eines möglichen, gemeinsam zu realisierenden Projekts ausgetauscht. Das Ergebnis war, dass wir uns am 20. November um 18 Uhr treffen möchten, um gemeinsam an einer Wohnlagenkarte fĂŒr Bielefeld zu arbeiten, um dabei miteinander neue Dinge auszuprobieren und lernen zu können, e.g. R, Python, Geodaten-Verarbeitung, OpenStreetMap-API, Bewertungs-Algorithmus Wohnlage, … Weitere Informationen findet ihr auf der Seite vom Code-Sprint. FĂŒr die Organisation des Code-Sprints wird demnĂ€chst ein Meetup erstellt.

 

Next Meetup: Entwicklung von Personas mit quantitativen und qualitativen Methoden

Am 9. Oktober 2018 findet unser nĂ€chstes Data Science Meetup Bielefeld statt. Wir treffen uns um 19 Uhr in der Lobby der Volksbank Bielefeld-GĂŒtersloh eG, Kesselbrink 1 in Bielefeld.

Im ersten Teil des Abends wird Lars Marek einen Vortrag zur Entwicklung von Personas mit quantitativen und qualitativen Methoden im Bereich des gesetzlichen Krankenversicherungsmarktes halten. Personas sind Kunden- oder Nutzermodelle, die Personen einer Zielgruppe charakterisieren. Durch Segmentierungs- und Clusteranalyseverfahren lassen sich aus geeigneten Nutzerdaten (neben Stamm- und Transaktionsdaten zÀhlen dazu beispielsweise auch Online-Befragungen oder Interviews) sogenannte Kern- und Randpersonas ermitteln, die Hauptnutzergrupen und Untergruppen reprÀsentieren.

UrsprĂŒnglich wurden Personas im Marketing/Vertrieb eines Unternehmens eingesetzt, um z.B. zielgruppengerecht Neukunden anzuwerben. Das Konzept der Personas kann aber im gesamten Unternehmen eingesetzt werden, um daraus gewonnene Erkenntnisse in neue Produkte, Services und die strategische Ausrichtung eines Unternehmens einfließen zu lassen.

Im zweiten Teil des Abends widmen wir uns wieder einem Code Sprint. Als Inspiration verwenden wir die Wohlagenkarte von Open Data Bielefeld: https://stadtplan.bielefeld.de/app/wohnlagenkarte/
Unser Ziel ist es ĂŒber mehrere Code Sprints diese Anwendung von Geo- und weiteren Daten auszubauen, hin zu einer Karte mit einer dynamischen „Lebenswert“-FĂ€rbung basierend auf Eingaben des Anwenders. Get involved early!

Um vorherige Anmeldung im Data Science Meetup Bielefeld wird gebeten!