GitHub topics: ngram-analysis
euskadi31/go-ngram
an n-gram is a contiguous sequence of n items from a given sequence of text or speech.
langage: Go - taille: 44,9 ko - dernière synchronisation: il y a 8 jours - enregistré: il y a 8 jours - étoiles: 2 - forks: 0

KhaledAshrafH/Auto-Filling-Text
This project is an auto-filling text program implemented in Python using N-gram models. The program suggests the next word based on the input given by the user. It utilizes N-gram models, specifically Trigrams and Bigrams, to generate predictions.
langage: Python - taille: 27,1 Mo - dernière synchronisation: il y a environ un mois - enregistré: il y a environ 2 mois - étoiles: 16 - forks: 4

myawesomebike/Text-Extraction-and-Processing
Crawl websites and extract meaningful information from HTML and site content
langage: Python - taille: 8,79 ko - dernière synchronisation: il y a 4 mois - enregistré: il y a plus de 3 ans - étoiles: 2 - forks: 1

roverbird/nbd-technical-analysis
Modeling trading data using the Negative Binomial Distribution (NBD)
langage: Python - taille: 2,03 Mo - dernière synchronisation: il y a 6 mois - enregistré: il y a 6 mois - étoiles: 0 - forks: 0

michbur/biogram
N-Gram Analysis of Biological Sequences
langage: R - taille: 4,57 Mo - dernière synchronisation: il y a 4 jours - enregistré: il y a 9 mois - étoiles: 10 - forks: 1

nickduran/align-linguistic-alignment
Python library for extracting quantitative, reproducible metrics of multi-level alignment between two speakers in naturalistic language corpora.
langage: Python - taille: 54,8 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a plus d'un an - étoiles: 38 - forks: 11

Babar-Bashir/YouTubeAdultFilter
Restrict your child to watching Adult Content on YouTube using Android Accessibility.
langage: Java - taille: 167 ko - dernière synchronisation: il y a environ un mois - enregistré: il y a plus de 7 ans - étoiles: 16 - forks: 10

behitek/word-counter
Dynamic n-gram counter on large text corpus (including next and previous)
langage: Java - taille: 15 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a presque 3 ans - étoiles: 0 - forks: 0

wmentor/qgram
N-gram Go library
langage: Go - taille: 12,7 ko - dernière synchronisation: il y a 2 mois - enregistré: il y a plus de 2 ans - étoiles: 2 - forks: 0

T22sri/Personality_Recognition_NLP
Personality Recognition from text using nlp techniques
langage: Jupyter Notebook - taille: 6,14 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a environ un an - étoiles: 0 - forks: 0

elaad24/search-engine 📦
full stack project - search engine mini project - Deloitte home task
langage: TypeScript - taille: 44,1 Mo - dernière synchronisation: il y a environ 2 mois - enregistré: il y a plus de 2 ans - étoiles: 1 - forks: 0

jamielaird/ngram-counter
A workflow using Alteryx, Python and Tableau to extract and analyse n-grams from a large set of raw email text.
langage: Python - taille: 53,2 Mo - dernière synchronisation: il y a plus d'un an - enregistré: il y a presque 8 ans - étoiles: 2 - forks: 2

jzonthemtn/ngramdb 📦
Distributed storage and querying of N-grams.
langage: Java - taille: 27,3 ko - dernière synchronisation: il y a 7 jours - enregistré: il y a environ 6 ans - étoiles: 1 - forks: 0

dibyasonu/Malware-Analysis
Malware Family Classification.
langage: Assembly - taille: 3,83 Mo - dernière synchronisation: il y a presque 2 ans - enregistré: il y a plus de 5 ans - étoiles: 3 - forks: 2

krmbzds/turkish-presidents-in-books
🇹🇷 Occurrences of Turkish presidents in books (1920-2008)
langage: HTML - taille: 5,86 ko - dernière synchronisation: il y a presque 2 ans - enregistré: il y a presque 7 ans - étoiles: 1 - forks: 0

Koziev/WordRepresentations
Сравнение нескольких способов представления слов для построения языковых моделей
langage: Python - taille: 128 Mo - dernière synchronisation: il y a presque 2 ans - enregistré: il y a plus de 7 ans - étoiles: 6 - forks: 4

Shounak007/N-Gram-Distribution-and-TD-IDF-Analysis
We will do a basic textual analysis to study the n-gram distribution of different languages, and examine a "mystery" text to determine what language it is in. We will then perform a TF-IDF analysis on that dataset.
langage: Python - taille: 0 octet - dernière synchronisation: il y a presque 2 ans - enregistré: il y a presque 2 ans - étoiles: 0 - forks: 0

ngrams-dev/general
NGRAMS is a search engine for the Google Books Ngram Dataset. This repository contains documentation, discussions, announcements, and issues.
taille: 31,3 ko - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 2 ans - étoiles: 5 - forks: 0

ZirvedaAytimur/Natural-Language-Processing-NLP-
The examples I prepared and brought together about the natural language processing topics I learned.
langage: Jupyter Notebook - taille: 42,7 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 4 ans - étoiles: 6 - forks: 2

AmbarZaidi/Name-based-Gender-Prediction
GuessMyGender - A Name based Gender Predictor for Indian Names
taille: 354 ko - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 7 ans - étoiles: 5 - forks: 0

toolforgeio/ngram-gap-tool
Compares keyword frequency analyses between two bodies of text
langage: Java - taille: 48,8 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus d'un an - étoiles: 0 - forks: 0

data-integrations/ngram-analytics 📦
NGram Analytics Transform Plugin: Transforms input features into n-grams
langage: Java - taille: 50,8 ko - dernière synchronisation: il y a environ un an - enregistré: il y a plus de 4 ans - étoiles: 0 - forks: 2

toolforgeio/ngrams-tool
Performs an ngram frequency analysis on a text corpus stored in a spreadsheet
langage: Java - taille: 104 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus d'un an - étoiles: 0 - forks: 0

FilipHalon/text_historical_authenticity_evaluation
A study on the historical authenticity of a text. The historical authenticity is evaluated by comparing the frequencies of unigrams, bigrams and trigrams of a given text to the frequencies of the ngrams of texts written in the period of +/- 5 years from the claimed date of the release of the given text and to the frequency of the ngrams of recent texts. A tool to visualise the findings made with pandas and matplotlib-pyplot is included.
langage: Jupyter Notebook - taille: 1,01 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a presque 5 ans - étoiles: 1 - forks: 1

shivangraikar/NLP-Patient-summary
Natural language processing project to calculate patient readmission probability and summary of notes.
langage: Jupyter Notebook - taille: 184 ko - dernière synchronisation: il y a 29 jours - enregistré: il y a presque 4 ans - étoiles: 4 - forks: 1

pikulet/language-model
language ngram model, information retrieval assignment
langage: Python - taille: 52,7 ko - dernière synchronisation: il y a environ 2 mois - enregistré: il y a presque 3 ans - étoiles: 0 - forks: 0

linguistic-dev/n-gram-extractor
A PHP Library to extract n-grams from a text. Simple preprocessing tools (cleaning, tokenizing) included.
langage: PHP - taille: 28,3 ko - dernière synchronisation: il y a 3 jours - enregistré: il y a plus de 7 ans - étoiles: 3 - forks: 0

myawesomebike/TFIDF
A Python web crawler with TF-IDF and ngram analysis
langage: Python - taille: 81,1 ko - dernière synchronisation: il y a 4 mois - enregistré: il y a plus de 3 ans - étoiles: 0 - forks: 1

jonathanrjpereira/Ngram-Analytica
📈 Gathers & Plots the Google Ngram Graph for any Ngram in Python
langage: Python - taille: 438 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus de 6 ans - étoiles: 3 - forks: 1

GuruMulay/big-data-class
Some of the projects from my Big Data class
langage: Java - taille: 5,55 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a plus de 6 ans - étoiles: 1 - forks: 0

maedi/NGrammer
Creates ngrams from wordlists.
langage: Ruby - taille: 4,83 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a plus de 4 ans - étoiles: 3 - forks: 0
