Meetup #15 Transparenz, Open Data und Citizen Science

Am 6. Mai 2021 erwarten wir zwei Vorträge bei unserem Data Science Meetup.

Durch die Diesel-Debatte in den letzten Jahren und Diskussionen rund um das Thema Stadt- und Verkehrsentwicklung ist das Thema Feinstaub und Luftqualität in den Fokus der Öffentlichkeit gerückt und ist Gegenstand des ersten Vortrags.

Andreas Czerniak beginnt mit einer Einführung in die Feinstaubproblematik. Er stellt uns die https://sensor.community/ vor, eine Community, die mittlerweile weltweit Daten zur Luftqualität sammelt und interessierten Bastler:innen DIY Anleitungen für den Bau eigener Feinstaub-, Luftqualitäts- und Lärmmessstationen zur Verfügung stellt. Die Daten der Sensor Community stehen als Open Data zur Verfügung. In Bielefeld stehen an verschiedenen Stellen seit 2016 selbstgebaute Sensoren dieser Art und liefern seit dem Messdaten an das Projekt. Die Auswertung dieser Daten aus den letzten Jahren und ein Vergleich mit dem Corona-Jahr 2020 wird vorgestellt.

Andreas hat in seinem Studium die Informatik mit der Physik des Meeres (die Ozeanographie)  verbunden und engagiert sich bei Code for Bielefeld.

Der zweite Vortrag schließt sich an den Vortrag aus dem Januar zu Machine Learning on the edge an und wird voraussichtlich eine Quantisierung von YOLOv4 zeigen. Details dazu folgen und werden auf der Meetup-Seite bekannt gegeben.

Anmeldung und Details: https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528224/

Upcoming Events 2021

Wir hoffen, ihr seid alle gut und gesund in das neue Jahr gekommen. Die Planungen für unsere Vortragsabende in 2021 laufen bereits auf Hochtouren.

Der erste Vortrag am 9. Februar 2021 um 19 Uhr behandelt das Thema Tiny ML – Machine Learning für eingebettete Systeme. Weitere Infos zum Vortrag und Referenten Jens Siebert, sowie Anmeldung und später auch Zoom-Link findet ihr auf der Event-Seite https://www.meetup.com/Data-Science-Meetup-Bielefeld/events/273528212/

Save the Date für die späteren Termine: Mai 2021, 26. August und 9. November.

Wir haben bereits Zusagen von Andreas Czerniak zu Luftqualitätsdaten in Bielefeld, Prof. Christian Schwede über den Forschungsmaster an der FH Bielefeld und darin bearbeiteten Projekten und einem Vortrag zu Reinforcement Learning vom Fraunhofer IOSB-INA.

Wir würden uns freuen, euch beim nächsten Meetup Willkommen heißen zu dürfen. Bleibt bis dahin gesund und munter!

Euer Orga-Team: Florian, Meike, Philipp

Meetup #12: Multi-Object Tracking in Videos // Erfahrungen beim Aufbau eines Data Science Teams

Nach dem Themenabend zur Bildverarbeitung im Mai findet das mittlerweile zwölfte Data Science Meetup wieder als Vortragsabend via Zoom statt. Wir freuen uns auf den Vortrag Scaling Data Science is translating Data Science – Erfahrungen und Herausforderungen beim Aufbau eines AI & Data Science Teams von Dr. Florian Nielsen (Miele) und den Vortrag Multi-Object Tracking auf Basis der Kombination von heuristischen und Deep Learning-Verfahren von Michel Ehmen und Denis Stalz-John (beide codecentric).

Daten sind das neue Öl – der Treibstoff der Digitalisierung und insbesondere von daten-getriebenen Produkten und Services. Der Mehrwert der Verwertung von Daten wird überall proklamiert. Aber wie fange ich an? Wer fängt an? Wie organisiere ich diese Unternehmung? Im ersten Vortrag geht Dr. Florian Nielsen auf die Erfahrungen, Herausforderungen und Lösungsansätze beim Aufbau eines AI & Data Science Teams und die Etablierung in einem familiengeführten Unternehmen ein.


Im zweiten Vortrag reden Michel Ehmen und Denis Stalz-John über Verfahren zum Tracken von Personen in Videos. Im ersten Teil des Vortrags stellt Michel die Ergebnisse seiner Masterarbeit vor, in der er mit verschiedenen Computer Vision Methoden und Deep Learning Verfahren ein möglichst stabiles Personen-Tracking zur Analyse von Fußballspielen entwickelt hat. Unter anderem zeigt er dabei, wie die Koordinaten der Spieler aus einem Video in echte Spielfeldkoordinaten übertragen werden können. Der zweite Teil des Vortrags beschäftigt sich damit, wie das Vorgehen des Personen-Trackings auch zur Messung von Abständen zwischen Personen genutzt werden kann. Diese Technologie kann bei bei der aktuellen Herausforderung der Einhaltung von Abstandsregeln und somit zur Reduktion der Infektionsgefahr durch SARS-CoV-2 eingesetzt werden.

Anmeldung und weitere Infos/Zoom-Link gibt es auf unserer Meetup-Seite:

Multi-Object Tracking in Videos/Erfahrungen beim Aufbau eines Data Science Teams

Tuesday, Aug 18, 2020, 7:00 PM

Online event
,

25 Dataworkers Attending

Nach dem Themenabend zur Bildverarbeitung im Mai findet das mittlerweile zwölfte Data Science Meetup wieder als Vortragsabend via Zoom (Link wird zeitnah zur Verfügung gestellt) statt. Wir freuen uns auf den Vortrag „Scaling Data Science is translating Data Science – Erfahrungen und Herausforderungen beim Aufbau eines AI & Data Science Teams“ von D…

Check out this Meetup →

Themenabend Image Processing

COVID-19 stellt uns alle vor neue Herausforderungen. Wir planen jetzt nicht nur unsere erste reine Remote-Veranstaltung, sondern probieren dabei wie geplant auch ein neues Format für unser Data Science Meetup aus – der Themenabend: Wir erkunden in mehreren Blöcken das Thema Image Processing. Von prä-CNN-Verfahren bis zu Transfer Learning versuchen wir eine große Bandbreite abzudecken. Dabei werden die öffentlichen Vortragsinhalte parallel in (Jupyter-)Notebooks vorgestellt und miteinander geteilt. So wird jeder Interessierte in die Lage versetzt, die Themen praktisch nachzuvollziehen.

17:00 Vorlauf – Begrüßung
17:30 Themenblock 1: „pre-CNN“, Dr. Michael Thies (CITEC)
18:15 Themenblock 2: „early-stage CNN“, Anton Pfeifer (inIT Lemgo)
19:00 Themenblock 3: „Transfer Learning, model zoo“, Michael Adams (CITEC)
19:45 Diskussionsrunden/Breakout Sessions mit den Referenten

Wir sind an diesem Themenabend Kooperationspartner von Digital in NRW. Die Anmeldung kann über Meetup oder Digital in NRW erfolgen. https://www.digital-in-nrw.de/de/termine-themen/veranstaltungen/webinar-ml-deep-dive-image-processing-webinar-ml-deep-dive-image-processing

Das Webinar erfolgt per ZOOM Video­kon­fe­renz. Zur Teilnahme reicht ein Browser oder Smart­phone, alle Inhalte werden über Browser zur Verfügung gestellt. Für die prak­ti­sche Mitarbeit wird ein Google-Account, zur Nutzung der „Jupyter-Notebooks“ benötigt. Die Zugangs­daten zu der Veran­stal­tung, sowie weitere Infor­ma­tionen, werden im Zuge der Anmeldung verteilt.

Deep Learning for Improving Computer Vision Tasks and Enabling Automated Processes in Industry

Am 10. Oktober gibt es das nächste Data Science Bielefeld Meetup. Wir erwarten einen Vortrag von André Kochanke und Yannick Franke von Go Reply über zwei Use-Cases aus dem Computer Vision-Bereich. Zum einen wird eine Kombination aus Deep Learning Modellen und verschiedenen Post-Processing Schritten zum Auffinden und Bewerten von Produktionsfehlern vorgestellt. Zum anderen wird ein Ansatz zur automatisierten Erkennung von Versicherungsbetrug durch Manipulationen an Schadensbildern mit Hilfe von ML gezeigt.

Weitere Infos und Anmeldungen:

Data Science Meetup Bielefeld

Bielefeld, DE
462 Dataworkers

“In God we trust, all others must bring data” ist Jahrzehnte alt und zeigt wie grundlegend Daten für Entscheidungen sein können. Wir sehen immer mehr davon: Entscheidungen auf…

Next Meetup

Data Science Meetup #9 Deep Learning for Improving Computer …

Thursday, Oct 10, 2019, 7:00 PM
43 Attending

Check out this Meetup Group →

Chatbot bauen und Nachfrage prognostizieren: das nächste Data Science Meetup steht in den Startlöchern

Am 11.7.2019 begrüßen wir um 19 Uhr in der Bürgerwache in Bielefeld gleich zwei Referenten. Zum einen kommt Matthias Ulrich, REWE Digital GmbH, zu uns mit einem Vortrag zum Thema „Distributional regression and model selection for demand forecasting in e-grocery“. Neben seiner Tätigkeit als Product Owner im Bereich Supply Chain Analytics beschäftigt er sich auch in seiner PhD Thesis, die er an der Uni Bielefeld in der Arbeitsgruppe Statistik und Datenanalyse schreibt, mit Prognosemodellen zu Nachfragevorhersagen.

Zum anderen freuen wir uns auf den Vortrag „Von Daten zu Konversationen“ von Dr. Christina Unger (Mercury.AI): „Wir geben einen Einblick in die Chatbot-Plattform von Mercury.ai und zeigen wie man auf der Grundlage von vorhandenen Daten dynamisch Dialog führen kann. Dabei soll es v.a. um Herausforderungen gehen, sowohl bei der Organisation der Daten als auch beim Überbrücken von Unterschieden zwischen Daten und Sprache.“

Anmeldung wie immer auf Meetup.com.

Rückblick Building Interpretable Neural Networks with Keras and LIME

Es gab am 11.4.2019 einen Vortrag von Shirin Glander zu Keras und LIME. Damit wir alle Shirin besser kennenlernen konnten, haben wir (Florian, Philipp und Meike) uns drei Fragen überlegt, die unsere Referenten*innen in Zukunft vor ihrem jeweiligen Vortrag in der Vorstellungsrunde beantworten müssen.

 (1) In welchem Kontext hast du das erste Mal mit Daten gearbeitet?

Während des Biologiestudiums beim Laborexperiment. Es hatte etwas mit Mäusen in Gläsern und deren Sauerstoffgehalt zu tun…

 (2) Der Data Scient ist ist eine Mischung aus Hacker, Mathe Nerd und Business Mensch: wie sind die Anteile bei dir verteilt?

Durch das Biologiestudium sehe ich bei mir den Hauptanteil im Bereich klassischer Statistik

 (3) Dein persönliches Data Fuck Up: welche Frage konntest du nicht mit Daten beantworten?

Ein richtiges Data Fuck Up gab es bis jetzt nicht, eher die Probleme, dass von Kunden Daten kommen, die gemerged werden sollen und nach 3 Tagen wird bemerkt: Ups, falscher Auszug aus der Datenbank…

(Die Antworten stammen aus dem Gedächtnisprotokoll).

Beim Vortrag hat Shirin ein Convolutional Neuronales Netz zur Bilderkennung von Früchten, welches sie mit Keras gebaut hatte, gezeigt. Keras hat sie dabei als Baukastensystem beschrieben, mit dem alle Varianten an Neuronalen Netzen gebaut und geschätzt werden können. Um das Neuronale Netz besser zu verstehen, kam dann im zweiten Schritt LIME zum Einsatz, um herauszufinden, aufgrund welcher Pixel in den Testbildern ein Bild beispielsweise als Banane klassifiziert worden ist. Den Code gibt es zum Nachlesen auf Shirins Blog: (1)  Image Classification with Keras und (2) Explaning Keras image classification models with lime.  Außerdem auch noch den Link zum empfohlenen Video zur weiteren Erläuterung von LIME.

Diese Informationen plus die Slides findet ihr auch in unserem Git Repository.

We need to make sure that our models are not going to cause harm to people or society.

Building Interpretable Neural Networks with Keras and LIME

Wie bereits angekündigt, wird am 11. April 2019 Shirin Glander bei uns einen Vortrag halten. Die Details:

„Building Interpretable Neural Networks with Keras and LIME“ von Dr. Shirin Glander, Data Scientist codecentric AG.

Keras is a high-level open-source deep learning framework that by default works on top of TensorFlow. Keras is minimalistic, efficient and highly flexible because it works with a modular layer system to define, compile and fit neural networks. It has been written in Python but can also be used from within R. Because the underlying backend can be changed from TensorFlow to Theano and CNTK (with more options being developed right now) it is designed to be framework-independent. Models can be trained on CPU or GPU, locally or in the cloud.
Shirin will show an example of how to build an image classifier with Keras. We’ll be using a convolutional neural net to classify fruits in images. But that’s not all! We not only want to judge our black-box model based on accuracy and loss measures – we want to get a better understanding of how the model works. We will use an algorithm called LIME (local interpretable model-agnostic explanations) to find out what part of the different test images contributed most strongly to the classification that was made by our model.
Shirin will introduce LIME and explain how it works. And finally, she will show how to apply LIME to the image classifier we built before, as well as to a pre-trained Imagenet model.

Über die Vortragende: Shirin Glander hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. Regelmäßig bloggt sie über Data-Science-Themen (https://www.shirin-glander.de/), führt Projekte in und rundum Data Science durch und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Alle weiteren Infos und Anmeldung zum Event über meetup.com.

Upcoming Events 2019

Wir freuen uns auf das nächste Meetup am 11. April 2019 mit Dr. Shirin Glander, Data Scientist codecentric AG. Sie hat in Bioinformatik promoviert und nutzt von Statistik bis Machine Learning verschiedene Methoden, um aus Daten spannende und neue Erkenntnisse zu gewinnen. Regelmäßig bloggt sie über Data-Science-Themen (https://www.shirin-glander.de/) und gibt Schulungen, unter anderem zu Deep Learning mit Keras.

Und auch die nächsten Termine bis November2019  sind bereits geplant:

  • 9.5.2019 – Code Night #3
  • 11.7.2019 – Meetup #8 Demand forecasting in e-grocery
  • 12.9.2019 – Code Night #4
  • 10.10.2019 – Meetup #9 Machine Learning in the industry
  • 14.11.2019 – Code Night #5

Details sind wie gewohnt auf meetup.com zu finden.

Rückblick und Ausblick – Save the date

SAVE THE DATE:

  • 20. November 2018 18 Uhr, Code Sprint
  • 11. Dezember 2018 18 Uhr, weihnachtliches Treffen auf dem Weihnachtsmarkt Bielefeld (Alter Markt, Lions Glühweinbude)

Bei unserem letzten Treffen am 9.11.2018 am Kesselbrink in der Volksbank Bielefeld-Gütersloh hat uns im ersten Teil Lars Marek einen Vortrag zur Entwicklung von Personas gehalten. Dabei stellte er das Zusammenspiel von quantitativen Methoden (Generierung von Hard Facts) und qualitativen Methoden (Anreicherung mit Soft Facts) sehr gut dar und wie aus diesen Informationen Ableitungen für ein zielgenaues Marketing gemacht werden können. Vielen Dank dafür!

Anschließend haben wir uns in der Gruppe über Formate eines Code Sprints und eines möglichen, gemeinsam zu realisierenden Projekts ausgetauscht. Das Ergebnis war, dass wir uns am 20. November um 18 Uhr treffen möchten, um gemeinsam an einer Wohnlagenkarte für Bielefeld zu arbeiten, um dabei miteinander neue Dinge auszuprobieren und lernen zu können, e.g. R, Python, Geodaten-Verarbeitung, OpenStreetMap-API, Bewertungs-Algorithmus Wohnlage, … Weitere Informationen findet ihr auf der Seite vom Code-Sprint. Für die Organisation des Code-Sprints wird demnächst ein Meetup erstellt.