Bonjour ! Je m'appelle Jocelyn

Je suis à la recherche d'un stage en NLP appliqué d'une durée maximale de 6 mois, à partir de mars 2025.


A propos de moi

Je suis étudiante américaine dans le domaine de l'intelligence artificielle, spécialisée en traitement automatique des langues (NLP).


Comment en suis-je arrivé à poursuivre mes études en France ?

`

Depuis quelque temps, je suis fascinée par la manière dont les assistants vocaux deviennent plus naturels. Cela m'a poussée à poursuivre mes études à l'Université Paris Cité pour obtenir une licence en linguistique et informatique, afin d'élargir ma compréhension de la linguistique, les mathématiques et l'informatique qui se marient pour rendre la technologie plus « humaine ». C'est là que j'ai développé un intérêt marqué pour l'intersection entre la langue et la technologie !


Très motivée par cet univers, je continue maintenant en Master de Traitement Automatique des Langues (NLP) à l'Université Sorbonne Nouvelle, en partenariat avec l'Université Paris Nanterre et l'INALCO


Ma passion pour le NLP vient de son potentiel à rendre la communication homme-machine plus naturelle. Un aspect clé de mes études est l'importance de la diversité linguistique, en incluant les langues et dialectes moins représentés qui apportent des perspectives uniques.

Projets selectionnés : 🧶 🐈

  • Application Web NLP: Decouverture de College Radio aux États-Unis

    Je travaille actuellement sur les bases pour développer une application avec Django pour le développement et l’ingénierie des fonctionnalités et utilisant du NLP. Cette application vise à faciliter l'accès aux programmes des radios universitaires en proposant des recommandations personnalisées pour une expérience d'écoute plus engageante

    En cours
  • Portfolio

    Ce site a été créé pour me permettre de partager mes futurs travaux et de me connecter avec d'autres personnes intéressées par la linguistique computationnelle.

    Vous êtes au cœur de l'action
  • Moteur de recherche basé sur l'approche vectorielle

    Dans le cadre d'un projet de groupe, nous construisons un programme de moteur de recherche en Python qui utilise le modèle vectoriel pour rechercher efficacement dans un grand ensemble de documents textuels. Nous avons deux modes de fonctionnement : un mode interactif pour une interaction en temps réel avec l'utilisateur et un mode batch pour évaluer les performances du système. Nous nous concentrons sur l'exploration de différentes méthodes de calcul des scores de pertinence afin d'améliorer la précision du moteur de recherche.

    Découvrir →
  • Analyse des discours présidentiels à travers le temps

    Ce projet recrée la méthode TF-IDF de zéro pour extraire des thèmes récurrents dans les discours des présidents américains. Initialement développé en Java et repris en Python, il permet d’extraire des insights sur l’évolution des priorités et des tonalités au fil des époques.

    Découvrir →

Education

  • Université Sorbonne Nouvelle - Paris III
  • TAL Master 1
  • Septembre 2024 - Présent

  • Co-habitation : l'Université Paris Nanterre et l'Institut National des Langues et Civilisations Orientales (INALCO)

  • Université Paris Cité
  • Linguistique et Informatique L3
  • Juillet 2024

Compétences

Informatique

  • Langages : Python, Bash, SQL, Java, HTML, CSS
  • Bibliothèque : Numpy, Scikit-learn, SpaCy, Hugging Face, MLextend, Pandas, Matplotlib, Seaborn
  • Outils : Visual Studio Code, Pycharm, Git (Version control), Praat

Traitement de texte

  • TF-IDF, Bag of Words, One-Hot Encoding, Vectorisation, Tokenisation, Word2Vec, Regex

Machine Learning

  • IA générative, LLMs, Modèles Transformer, Réseaux neuronaux, Recherche d’information, Classification, Apprentissage supervisé, Fonctions de coût (Loss functions) et optimisation (Descente de gradient), Mathématiques (Algèbre linéaire, Probabilité et Statistiques appliquées au NLP), Métriques d’évaluation (Matrice de confusion, Précision, Rappel, F1-score)

Linguistique

  • Analyse linguistique, Analyse phonétique et acoustique, Synthèse de la parole, Collecte et analyse de données, Annotation de données pour l’entraînement de modèles TAL

Développment Professional

  • Application web en python Django

    Codeacademy

    En cours

  • Feature Engineering

    Codeacademy

    Validé: Août 2024

  • SQL

    Codeacademy

    Validé: Juillet 2024

  • Foundations of User Experience (UX) Design

    Google UX Design professional Certificate

    Validé: Juin 2022

Langues

  • Anglais - Langue maternelle
  • Français - Niveau C1
  • Espagnol - Niveau B2
  • Langue des Signes Française - Notions

Conférences Pertinentes

  • France Digital Day 2024 (Bénévole & participant)
  • The Symposium: AI Edition (Bénévole & participant)
  • France Digital Day 2023 (Bénévole)