An open API service providing repository metadata for many open source software ecosystems.

GitHub topics: ngram-analysis

euskadi31/go-ngram

an n-gram is a contiguous sequence of n items from a given sequence of text or speech.

langage: Go - taille: 44,9 ko - dernière synchronisation: il y a 8 jours - enregistré: il y a 8 jours - étoiles: 2 - forks: 0

KhaledAshrafH/Auto-Filling-Text

This project is an auto-filling text program implemented in Python using N-gram models. The program suggests the next word based on the input given by the user. It utilizes N-gram models, specifically Trigrams and Bigrams, to generate predictions.

langage: Python - taille: 27,1 Mo - dernière synchronisation: il y a environ un mois - enregistré: il y a environ 2 mois - étoiles: 16 - forks: 4

myawesomebike/Text-Extraction-and-Processing

Crawl websites and extract meaningful information from HTML and site content

langage: Python - taille: 8,79 ko - dernière synchronisation: il y a 4 mois - enregistré: il y a plus de 3 ans - étoiles: 2 - forks: 1

roverbird/nbd-technical-analysis

Modeling trading data using the Negative Binomial Distribution (NBD)

langage: Python - taille: 2,03 Mo - dernière synchronisation: il y a 6 mois - enregistré: il y a 6 mois - étoiles: 0 - forks: 0

michbur/biogram

N-Gram Analysis of Biological Sequences

langage: R - taille: 4,57 Mo - dernière synchronisation: il y a 4 jours - enregistré: il y a 9 mois - étoiles: 10 - forks: 1

nickduran/align-linguistic-alignment

Python library for extracting quantitative, reproducible metrics of multi-level alignment between two speakers in naturalistic language corpora.

langage: Python - taille: 54,8 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a plus d'un an - étoiles: 38 - forks: 11

Babar-Bashir/YouTubeAdultFilter

Restrict your child to watching Adult Content on YouTube using Android Accessibility.

langage: Java - taille: 167 ko - dernière synchronisation: il y a environ un mois - enregistré: il y a plus de 7 ans - étoiles: 16 - forks: 10

behitek/word-counter

Dynamic n-gram counter on large text corpus (including next and previous)

langage: Java - taille: 15 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a presque 3 ans - étoiles: 0 - forks: 0

wmentor/qgram

N-gram Go library

langage: Go - taille: 12,7 ko - dernière synchronisation: il y a 2 mois - enregistré: il y a plus de 2 ans - étoiles: 2 - forks: 0

T22sri/Personality_Recognition_NLP

Personality Recognition from text using nlp techniques

langage: Jupyter Notebook - taille: 6,14 Mo - dernière synchronisation: il y a environ un an - enregistré: il y a environ un an - étoiles: 0 - forks: 0

elaad24/search-engine 📦

full stack project - search engine mini project - Deloitte home task

langage: TypeScript - taille: 44,1 Mo - dernière synchronisation: il y a environ 2 mois - enregistré: il y a plus de 2 ans - étoiles: 1 - forks: 0

jamielaird/ngram-counter

A workflow using Alteryx, Python and Tableau to extract and analyse n-grams from a large set of raw email text.

langage: Python - taille: 53,2 Mo - dernière synchronisation: il y a plus d'un an - enregistré: il y a presque 8 ans - étoiles: 2 - forks: 2

jzonthemtn/ngramdb 📦

Distributed storage and querying of N-grams.

langage: Java - taille: 27,3 ko - dernière synchronisation: il y a 7 jours - enregistré: il y a environ 6 ans - étoiles: 1 - forks: 0

dibyasonu/Malware-Analysis

Malware Family Classification.

langage: Assembly - taille: 3,83 Mo - dernière synchronisation: il y a presque 2 ans - enregistré: il y a plus de 5 ans - étoiles: 3 - forks: 2

krmbzds/turkish-presidents-in-books

🇹🇷 Occurrences of Turkish presidents in books (1920-2008)

langage: HTML - taille: 5,86 ko - dernière synchronisation: il y a presque 2 ans - enregistré: il y a presque 7 ans - étoiles: 1 - forks: 0

Koziev/WordRepresentations

Сравнение нескольких способов представления слов для построения языковых моделей

langage: Python - taille: 128 Mo - dernière synchronisation: il y a presque 2 ans - enregistré: il y a plus de 7 ans - étoiles: 6 - forks: 4

Shounak007/N-Gram-Distribution-and-TD-IDF-Analysis

We will do a basic textual analysis to study the n-gram distribution of different languages, and examine a "mystery" text to determine what language it is in. We will then perform a TF-IDF analysis on that dataset.

langage: Python - taille: 0 octet - dernière synchronisation: il y a presque 2 ans - enregistré: il y a presque 2 ans - étoiles: 0 - forks: 0

ngrams-dev/general

NGRAMS is a search engine for the Google Books Ngram Dataset. This repository contains documentation, discussions, announcements, and issues.

taille: 31,3 ko - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 2 ans - étoiles: 5 - forks: 0

ZirvedaAytimur/Natural-Language-Processing-NLP-

The examples I prepared and brought together about the natural language processing topics I learned.

langage: Jupyter Notebook - taille: 42,7 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 4 ans - étoiles: 6 - forks: 2

AmbarZaidi/Name-based-Gender-Prediction

GuessMyGender - A Name based Gender Predictor for Indian Names

taille: 354 ko - dernière synchronisation: il y a environ 2 ans - enregistré: il y a environ 7 ans - étoiles: 5 - forks: 0

toolforgeio/ngram-gap-tool

Compares keyword frequency analyses between two bodies of text

langage: Java - taille: 48,8 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus d'un an - étoiles: 0 - forks: 0

data-integrations/ngram-analytics 📦

NGram Analytics Transform Plugin: Transforms input features into n-grams

langage: Java - taille: 50,8 ko - dernière synchronisation: il y a environ un an - enregistré: il y a plus de 4 ans - étoiles: 0 - forks: 2

toolforgeio/ngrams-tool

Performs an ngram frequency analysis on a text corpus stored in a spreadsheet

langage: Java - taille: 104 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus d'un an - étoiles: 0 - forks: 0

FilipHalon/text_historical_authenticity_evaluation

A study on the historical authenticity of a text. The historical authenticity is evaluated by comparing the frequencies of unigrams, bigrams and trigrams of a given text to the frequencies of the ngrams of texts written in the period of +/- 5 years from the claimed date of the release of the given text and to the frequency of the ngrams of recent texts. A tool to visualise the findings made with pandas and matplotlib-pyplot is included.

langage: Jupyter Notebook - taille: 1,01 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a presque 5 ans - étoiles: 1 - forks: 1

shivangraikar/NLP-Patient-summary

Natural language processing project to calculate patient readmission probability and summary of notes.

langage: Jupyter Notebook - taille: 184 ko - dernière synchronisation: il y a 29 jours - enregistré: il y a presque 4 ans - étoiles: 4 - forks: 1

pikulet/language-model

language ngram model, information retrieval assignment

langage: Python - taille: 52,7 ko - dernière synchronisation: il y a environ 2 mois - enregistré: il y a presque 3 ans - étoiles: 0 - forks: 0

linguistic-dev/n-gram-extractor

A PHP Library to extract n-grams from a text. Simple preprocessing tools (cleaning, tokenizing) included.

langage: PHP - taille: 28,3 ko - dernière synchronisation: il y a 3 jours - enregistré: il y a plus de 7 ans - étoiles: 3 - forks: 0

myawesomebike/TFIDF

A Python web crawler with TF-IDF and ngram analysis

langage: Python - taille: 81,1 ko - dernière synchronisation: il y a 4 mois - enregistré: il y a plus de 3 ans - étoiles: 0 - forks: 1

jonathanrjpereira/Ngram-Analytica

📈 Gathers & Plots the Google Ngram Graph for any Ngram in Python

langage: Python - taille: 438 ko - dernière synchronisation: il y a plus d'un an - enregistré: il y a plus de 6 ans - étoiles: 3 - forks: 1

GuruMulay/big-data-class

Some of the projects from my Big Data class

langage: Java - taille: 5,55 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a plus de 6 ans - étoiles: 1 - forks: 0

maedi/NGrammer

Creates ngrams from wordlists.

langage: Ruby - taille: 4,83 Mo - dernière synchronisation: il y a environ 2 ans - enregistré: il y a plus de 4 ans - étoiles: 3 - forks: 0