Bonjour ! Je m'appelle Jocelyn

Je suis à la recherche d'un stage en programmation de maximum 6 mois à partir de Juin 2024.



A propos de moi

Je suis une étudiante américaine spécialisée en traitement automatique des langues à l'Université Paris Cité. Je suis quelqu'un qui aime apprendre, je commence à participer à des conférences en tant que bénévole ` pour rester informée des nouveautés dans le domaine de mes études et ceux qui me passionnent, comme l'olfaction, en raison de mon amour pour la parfumerie. Bien que le traitement automatique des langues (NLP) me fascine, je continue de m'informer sur diverses applications d'IA dans différents secteurs. Mon stage dans un laboratoire spécialisé en TAL m'a habituée à consulter régulièrement les études en machine learning lorsque un sujet m'interpelle particulièrement. Mon objectif est de travailler dans un domaine où je pourrais combiner le NLP et la parfumerie.


Je suis familière avec les sujets de NLP grâce aux projets guidés réalisés en classe, tels que l'identification de la langue des tweets en Python et l'extraction non supervisée de lexique bilingue en Java. J'ai également acquis des connaissances sur les commandes BASH pour extraire et formater des textes, que je peux combiner avec mes connaissances en REGEX pour extraire des parties spécifiques de texte. De plus, j’ai des notions d'optimisation algorithmique et de leur application dans ce domaine.


En tant que personne, je suis organisée, motivée, sérieuse dans mon travail. Je m'efforce toujours d'en apprendre davantage et d'intégrer des éléments de design dans mon travail.


Projets

Projets achevés 🎀

  • NLP Targeted Extract

    NLP Targeted Extract est un script Python qui permet aux utilisateurs d'extraire le texte des fichiers PDF, une page à la fois. Pour chaque page, le script génère deux fichiers distincts : un fichier texte contenant le texte extrait, et un fichier CSV contenant la fréquence de chaque mot qui apparaît dans le texte extrait. Il est ainsi facile d'analyser et de visualiser les données textuelles.

    Découvrir ce script
  • Portfolio

    Ce site a été créé pour me permettre de partager mes futurs travaux et de me connecter avec d'autres personnes intéressées par la linguistique computationnelle.

    Vous êtes au coeur de l'action !
  • Vector-based Search Engine

    Dans le cadre d'un projet de groupe, nous construisons un programme de moteur de recherche en Python qui utilise le modèle vectoriel pour rechercher efficacement dans un grand ensemble de documents textuels. Nous avons deux modes de fonctionnement : un mode interactif pour une interaction en temps réel avec l'utilisateur et un mode batch pour évaluer les performances du système. Nous nous concentrons sur l'exploration de différentes méthodes de calcul des scores de pertinence afin d'améliorer la précision du moteur de recherche.

    Date d'achèvement prévue : Mai 2023

En cours 🧶 🐈

  • En construction


Education

  • Université Paris Cité
  • Linguistique Informatique L3
  • Septembre 2022 - Présent

Compétences

  • Python
  • Java
  • Bash Commands
  • Regex
  • Html
  • CSS
  • Praat

Langues

  • Anglais (Langue maternelle)
  • Français Avancé
  • Espagnol Avancé

Cours actuels

  • Bases formelles du TAL : Probabilités et statistiques
  • Bases formelles du TAL : Analyse et algèbre linéaire
  • Programmation Java
  • Algorithmes
  • Théories syntaxiques : Grammaire générative
  • Phonologie
  • Morphologie
  • Pragmatique

Cours précédents

  • Bases formelles du TAL 1 : Aspects symboliques
  • Intro. à la programmation : Python
  • Intro. au traitement automatique du langage naturel
  • Méthodes expérimentales en psycholinguistique
  • Phonétique
  • Syntaxe
  • Sémantique

Développment Professional

  • Foundations of User Experience (UX) Design

    Google UX Design professional Certificate

    Validated: June 2022

  • Blockchain: Beyond the Basics

    Linkedin Learning

    Validated: April 2021