Meetup #15 Transparenz, Open Data und Citizen Science

Am 6. Mai 2021 erwarten wir zwei VortrÀge bei unserem Data Science Meetup.

Durch die Diesel-Debatte in den letzten Jahren und Diskussionen rund um das Thema Stadt- und Verkehrsentwicklung ist das Thema Feinstaub und LuftqualitĂ€t in den Fokus der Öffentlichkeit gerĂŒckt und ist Gegenstand des ersten Vortrags.

Andreas Czerniak beginnt mit einer EinfĂŒhrung in die Feinstaubproblematik. Er stellt uns die https://sensor.community/ vor, eine Community, die mittlerweile weltweit Daten zur LuftqualitĂ€t sammelt und interessierten Bastler:innen DIY Anleitungen fĂŒr den Bau eigener Feinstaub-, LuftqualitĂ€ts- und LĂ€rmmessstationen zur VerfĂŒgung stellt. Die Daten der Sensor Community stehen als Open Data zur VerfĂŒgung. In Bielefeld stehen an verschiedenen Stellen seit 2016 selbstgebaute Sensoren dieser Art und liefern seit dem Messdaten an das Projekt. Die Auswertung dieser Daten aus den letzten Jahren und ein Vergleich mit dem Corona-Jahr 2020 wird vorgestellt.

Andreas hat in seinem Studium die Informatik mit der Physik des Meeres (die Ozeanographie)  verbunden und engagiert sich bei Code for Bielefeld.

Der zweite Vortrag schließt sich an den Vortrag aus dem Januar zu Machine Learning on the edge an und wird voraussichtlich eine Quantisierung von YOLOv4 zeigen. Details dazu folgen und werden auf der Meetup-Seite bekannt gegeben.

Anmeldung und Details: https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528224/

Upcoming Events 2021

Wir hoffen, ihr seid alle gut und gesund in das neue Jahr gekommen. Die Planungen fĂŒr unsere Vortragsabende in 2021 laufen bereits auf Hochtouren.

Der erste Vortrag am 9. Februar 2021 um 19 Uhr behandelt das Thema Tiny ML – Machine Learning fĂŒr eingebettete Systeme. Weitere Infos zum Vortrag und Referenten Jens Siebert, sowie Anmeldung und spĂ€ter auch Zoom-Link findet ihr auf der Event-Seite https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528212/

Save the Date fĂŒr die spĂ€teren Termine: Mai 2021, 26. August und 9. November.

Wir haben bereits Zusagen von Andreas Czerniak zu LuftqualitĂ€tsdaten in Bielefeld, Prof. Christian Schwede ĂŒber den Forschungsmaster an der FH Bielefeld und darin bearbeiteten Projekten und einem Vortrag zu Reinforcement Learning vom Fraunhofer IOSB-INA.

Wir wĂŒrden uns freuen, euch beim nĂ€chsten Meetup Willkommen heißen zu dĂŒrfen. Bleibt bis dahin gesund und munter!

Euer Orga-Team: Florian, Meike, Philipp

Meetup #12: Multi-Object Tracking in Videos // Erfahrungen beim Aufbau eines Data Science Teams

Nach dem Themenabend zur Bildverarbeitung im Mai findet das mittlerweile zwölfte Data Science Meetup wieder als Vortragsabend via Zoom statt. Wir freuen uns auf den Vortrag Scaling Data Science is translating Data Science – Erfahrungen und Herausforderungen beim Aufbau eines AI & Data Science Teams von Dr. Florian Nielsen (Miele) und den Vortrag Multi-Object Tracking auf Basis der Kombination von heuristischen und Deep Learning-Verfahren von Michel Ehmen und Denis Stalz-John (beide codecentric).

Daten sind das neue Öl – der Treibstoff der Digitalisierung und insbesondere von daten-getriebenen Produkten und Services. Der Mehrwert der Verwertung von Daten wird ĂŒberall proklamiert. Aber wie fange ich an? Wer fĂ€ngt an? Wie organisiere ich diese Unternehmung? Im ersten Vortrag geht Dr. Florian Nielsen auf die Erfahrungen, Herausforderungen und LösungsansĂ€tze beim Aufbau eines AI & Data Science Teams und die Etablierung in einem familiengefĂŒhrten Unternehmen ein.


Im zweiten Vortrag reden Michel Ehmen und Denis Stalz-John ĂŒber Verfahren zum Tracken von Personen in Videos. Im ersten Teil des Vortrags stellt Michel die Ergebnisse seiner Masterarbeit vor, in der er mit verschiedenen Computer Vision Methoden und Deep Learning Verfahren ein möglichst stabiles Personen-Tracking zur Analyse von Fußballspielen entwickelt hat. Unter anderem zeigt er dabei, wie die Koordinaten der Spieler aus einem Video in echte Spielfeldkoordinaten ĂŒbertragen werden können. Der zweite Teil des Vortrags beschĂ€ftigt sich damit, wie das Vorgehen des Personen-Trackings auch zur Messung von AbstĂ€nden zwischen Personen genutzt werden kann. Diese Technologie kann bei bei der aktuellen Herausforderung der Einhaltung von Abstandsregeln und somit zur Reduktion der Infektionsgefahr durch SARS-CoV-2 eingesetzt werden.

Anmeldung und weitere Infos/Zoom-Link gibt es auf unserer Meetup-Seite:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/267354935/

Themenabend Image Processing

COVID-19 stellt uns alle vor neue Herausforderungen. Wir planen jetzt nicht nur unsere erste reine Remote-Veranstaltung, sondern probieren dabei wie geplant auch ein neues Format fĂŒr unser Data Science Meetup aus – der Themenabend: Wir erkunden in mehreren Blöcken das Thema Image Processing. Von prĂ€-CNN-Verfahren bis zu Transfer Learning versuchen wir eine große Bandbreite abzudecken. Dabei werden die öffentlichen Vortragsinhalte parallel in (Jupyter-)Notebooks vorgestellt und miteinander geteilt. So wird jeder Interessierte in die Lage versetzt, die Themen praktisch nachzuvollziehen.

17:00 Vorlauf – BegrĂŒĂŸung
17:30 Themenblock 1: „pre-CNN“, Dr. Michael Thies (CITEC)
18:15 Themenblock 2: „early-stage CNN“, Anton Pfeifer (inIT Lemgo)
19:00 Themenblock 3: „Transfer Learning, model zoo“, Michael Adams (CITEC)
19:45 Diskussionsrunden/Breakout Sessions mit den Referenten

Wir sind an diesem Themenabend Kooperationspartner von Digital in NRW. Die Anmeldung kann ĂŒber Meetup oder Digital in NRW erfolgen. https://www.digital-in-nrw.de/de/termine-themen/veranstaltungen/webinar-ml-deep-dive-image-processing-webinar-ml-deep-dive-image-processing

Das Webinar erfolgt per ZOOM Video­kon­fe­renz. Zur Teilnahme reicht ein Browser oder Smart­phone, alle Inhalte werden ĂŒber Browser zur VerfĂŒgung gestellt. FĂŒr die prak­ti­sche Mitarbeit wird ein Google-Account, zur Nutzung der „Jupyter-Notebooks“ benötigt. Die Zugangs­daten zu der Veran­stal­tung, sowie weitere Infor­ma­tionen, werden im Zuge der Anmeldung verteilt.

Deep Learning for Improving Computer Vision Tasks and Enabling Automated Processes in Industry

Am 10. Oktober gibt es das nĂ€chste Data Science Bielefeld Meetup. Wir erwarten einen Vortrag von AndrĂ© Kochanke und Yannick Franke von Go Reply ĂŒber zwei Use-Cases aus dem Computer Vision-Bereich. Zum einen wird eine Kombination aus Deep Learning Modellen und verschiedenen Post-Processing Schritten zum Auffinden und Bewerten von Produktionsfehlern vorgestellt. Zum anderen wird ein Ansatz zur automatisierten Erkennung von Versicherungsbetrug durch Manipulationen an Schadensbildern mit Hilfe von ML gezeigt.

Weitere Infos und Anmeldungen:

https://www.meetup.com/Data-Science-Meetup-Bielefeld/

Chatbot bauen und Nachfrage prognostizieren: das nÀchste Data Science Meetup steht in den Startlöchern

Am 11.7.2019 begrĂŒĂŸen wir um 19 Uhr in der BĂŒrgerwache in Bielefeld gleich zwei Referenten. Zum einen kommt Matthias Ulrich, REWE Digital GmbH, zu uns mit einem Vortrag zum Thema „Distributional regression and model selection for demand forecasting in e-grocery“. Neben seiner TĂ€tigkeit als Product Owner im Bereich Supply Chain Analytics beschĂ€ftigt er sich auch in seiner PhD Thesis, die er an der Uni Bielefeld in der Arbeitsgruppe Statistik und Datenanalyse schreibt, mit Prognosemodellen zu Nachfragevorhersagen.

Zum anderen freuen wir uns auf den Vortrag „Von Daten zu Konversationen“ von Dr. Christina Unger (Mercury.AI): „Wir geben einen Einblick in die Chatbot-Plattform von Mercury.ai und zeigen wie man auf der Grundlage von vorhandenen Daten dynamisch Dialog fĂŒhren kann. Dabei soll es v.a. um Herausforderungen gehen, sowohl bei der Organisation der Daten als auch beim ÜberbrĂŒcken von Unterschieden zwischen Daten und Sprache.“

Anmeldung wie immer auf Meetup.com.

RĂŒckblick Building Interpretable Neural Networks with Keras and LIME

Es gab am 11.4.2019 einen Vortrag von Shirin Glander zu Keras und LIME. Damit wir alle Shirin besser kennenlernen konnten, haben wir (Florian, Philipp und Meike) uns drei Fragen ĂŒberlegt, die unsere Referenten*innen in Zukunft vor ihrem jeweiligen Vortrag in der Vorstellungsrunde beantworten mĂŒssen.

 (1) In welchem Kontext hast du das erste Mal mit Daten gearbeitet?

WĂ€hrend des Biologiestudiums beim Laborexperiment. Es hatte etwas mit MĂ€usen in GlĂ€sern und deren Sauerstoffgehalt zu tun…

 (2) Der Data Scient ist ist eine Mischung aus Hacker, Mathe Nerd und Business Mensch: wie sind die Anteile bei dir verteilt?

Durch das Biologiestudium sehe ich bei mir den Hauptanteil im Bereich klassischer Statistik

 (3) Dein persönliches Data Fuck Up: welche Frage konntest du nicht mit Daten beantworten?

Ein richtiges Data Fuck Up gab es bis jetzt nicht, eher die Probleme, dass von Kunden Daten kommen, die gemerged werden sollen und nach 3 Tagen wird bemerkt: Ups, falscher Auszug aus der Datenbank


(Die Antworten stammen aus dem GedÀchtnisprotokoll).

Beim Vortrag hat Shirin ein Convolutional Neuronales Netz zur Bilderkennung von FrĂŒchten, welches sie mit Keras gebaut hatte, gezeigt. Keras hat sie dabei als Baukastensystem beschrieben, mit dem alle Varianten an Neuronalen Netzen gebaut und geschĂ€tzt werden können. Um das Neuronale Netz besser zu verstehen, kam dann im zweiten Schritt LIME zum Einsatz, um herauszufinden, aufgrund welcher Pixel in den Testbildern ein Bild beispielsweise als Banane klassifiziert worden ist. Den Code gibt es zum Nachlesen auf Shirins Blog: (1)  Image Classification with Keras und (2) Explaning Keras image classification models with lime.  Außerdem auch noch den Link zum empfohlenen Video zur weiteren ErlĂ€uterung von LIME.

Diese Informationen plus die Slides findet ihr auch in unserem Git Repository.

We need to make sure that our models are not going to cause harm to people or society.

Building Interpretable Neural Networks with Keras and LIME

Wie bereits angekĂŒndigt, wird am 11. April 2019 Shirin Glander bei uns einen Vortrag halten. Die Details:

„Building Interpretable Neural Networks with Keras and LIME“ von Dr. Shirin Glander, Data Scientist codecentric AG.

Keras is a high-level open-source deep learning framework that by default works on top of TensorFlow. Keras is minimalistic, efficient and highly flexible because it works with a modular layer system to define, compile and fit neural networks. It has been written in Python but can also be used from within R. Because the underlying backend can be changed from TensorFlow to Theano and CNTK (with more options being developed right now) it is designed to be framework-independent. Models can be trained on CPU or GPU, locally or in the cloud.
Shirin will show an example of how to build an image classifier with Keras. We’ll be using a convolutional neural net to classify fruits in images. But that’s not all! We not only want to judge our black-box model based on accuracy and loss measures – we want to get a better understanding of how the model works. We will use an algorithm called LIME (local interpretable model-agnostic explanations) to find out what part of the different test images contributed most strongly to the classification that was made by our model.
Shirin will introduce LIME and explain how it works. And finally, she will show how to apply LIME to the image classifier we built before, as well as to a pre-trained Imagenet model.

Über die Vortragende: Shirin Glander hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. RegelmĂ€ĂŸig bloggt sie ĂŒber Data-Science-Themen (https://www.shirin-glander.de/), fĂŒhrt Projekte in und rundum Data Science durch und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Alle weiteren Infos und Anmeldung zum Event ĂŒber meetup.com.

Upcoming Events 2019

Wir freuen uns auf das nĂ€chste Meetup am 11. April 2019 mit Dr. Shirin Glander, Data Scientist codecentric AG. Sie hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. RegelmĂ€ĂŸig bloggt sie ĂŒber Data-Science-Themen (https://www.shirin-glander.de/) und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Und auch die nÀchsten Termine bis November2019  sind bereits geplant:

  • 9.5.2019 – Code Night #3
  • 11.7.2019 – Meetup #8 Demand forecasting in e-grocery
  • 12.9.2019 – Code Night #4
  • 10.10.2019 – Meetup #9 Machine Learning in the industry
  • 14.11.2019 – Code Night #5

Details sind wie gewohnt auf meetup.com zu finden.

RĂŒckblick und Ausblick – Save the date

SAVE THE DATE:

  • 20. November 2018 18 Uhr, Code Sprint
  • 11. Dezember 2018 18 Uhr, weihnachtliches Treffen auf dem Weihnachtsmarkt Bielefeld (Alter Markt, Lions GlĂŒhweinbude)

Bei unserem letzten Treffen am 9.11.2018 am Kesselbrink in der Volksbank Bielefeld-GĂŒtersloh hat uns im ersten Teil Lars Marek einen Vortrag zur Entwicklung von Personas gehalten. Dabei stellte er das Zusammenspiel von quantitativen Methoden (Generierung von Hard Facts) und qualitativen Methoden (Anreicherung mit Soft Facts) sehr gut dar und wie aus diesen Informationen Ableitungen fĂŒr ein zielgenaues Marketing gemacht werden können. Vielen Dank dafĂŒr!

Anschließend haben wir uns in der Gruppe ĂŒber Formate eines Code Sprints und eines möglichen, gemeinsam zu realisierenden Projekts ausgetauscht. Das Ergebnis war, dass wir uns am 20. November um 18 Uhr treffen möchten, um gemeinsam an einer Wohnlagenkarte fĂŒr Bielefeld zu arbeiten, um dabei miteinander neue Dinge auszuprobieren und lernen zu können, e.g. R, Python, Geodaten-Verarbeitung, OpenStreetMap-API, Bewertungs-Algorithmus Wohnlage, … Weitere Informationen findet ihr auf der Seite vom Code-Sprint. FĂŒr die Organisation des Code-Sprints wird demnĂ€chst ein Meetup erstellt.