multimodality

Here are 72 public repositories matching this topic...

lucidrains / big-sleep

Sponsor

A simple command line tool for text to image generation, using OpenAI's CLIP and a BigGAN. Technique was originally created by https://twitter.com/advadnoun

deep-learning artificial-intelligence multimodality generative-adversarial-networks text-to-image

Updated Feb 6, 2022
Python

aimclub / FEDOT

Star

Automated modeling and machine learning framework FEDOT

machine-learning automation genetic-programming hyperparameter-optimization evolutionary-algorithms multimodality automl automated-machine-learning parameter-tuning structural-learning fedot

Updated Jan 31, 2023
Python

ArrowLuo / CLIP4Clip

Star

An official implementation for "CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval"

search retrieval ranking clip multimodality multimodal-learning multimodal activitynet retrieval-model msvd msrvtt video-text-retrieval lsmdc didemo video-clip-retrieval

Updated Dec 13, 2022
Python

afiaka87 / clip-guided-diffusion

Star

A CLI tool/python module for generating images from text using guided diffusion and CLIP from OpenAI.

deep-learning artificial-intelligence openai image-generation multimodality text-to-image diffusion multimodal text-to-image-synthesis openai-clip

Updated Feb 8, 2022
Python

lium-lst / nmtpytorch

Star

Sequence-to-Sequence Framework in PyTorch

deep-learning cnn pytorch speech-recognition seq2seq neural-machine-translation nmt multimodality asr

Updated Jan 5, 2023
Jupyter Notebook

HazyResearch / fonduer

Star

A knowledge base construction engine for richly formatted data

machine-learning multimodality knowledge-base-construction

Updated Jun 23, 2021
Python

zengyan-97 / X-VLM

Star

X-VLM: Multi-Grained Vision Language Pre-Training (ICML 2022)

multimodality vision-and-language x-vlm

Updated Nov 25, 2022
Python

microsoft / UniVL

Star

An official implementation for " UniVL: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation"

video localization caption alignment segmentation coin multimodality joint multimodal-sentiment-analysis pretrain pretraining msrvtt video-text-retrieval video-text video-language youcookii retrieval-task caption-task

Updated Nov 28, 2022
Python

soujanyaporia / multimodal-sentiment-analysis

Star

Attention-based multimodal fusion for sentiment analysis

natural-language-processing sentiment-analysis tensorflow lstm attention attention-mechanism multimodality dialogue-systems sentiment-classification conversational-agents

Updated Aug 28, 2021
Python

OmicsML / dance

Star

DANCE: A Deep Learning Library and Benchmark Platform for Single-Cell Analysis

python data-science benchmark machine-learning bioinformatics deep-learning computational-biology dance single-cell multimodality single-cell-rna-seq graph-neural-networks spatial-transcriptomics single-cell-rna-sequencing

Updated Jan 31, 2023
Python

srvk / how2-dataset

Star

This repository contains code and metadata of How2 dataset

language video machine-translation corpus dataset speech-recognition multimodality how2-dataset

Updated Nov 23, 2022
Python

Liang-ZX / VectorNet

Star

Pytorch implementation of CVPR2020 paper “VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation”

multimodality trajectory-prediction gnn

Updated May 26, 2022
Jupyter Notebook

Yutong-Zhou-cv / Awesome-Multimodality

Star

A Survey on multimodal learning research.

awesome-list multimodality multimodal-deep-learning

Updated Jan 1, 2023

senwu / emmental

Star

A deep learning framework for building multimodal multi-task learning systems.

machine-learning multimodality multi-task-learning

Updated May 7, 2022
Python

BiomedSciAI / fuse-med-ml

Star

A python framework accelerating ML based discovery in the medical field by encouraging code reuse. Batteries included :)

Updated Jan 30, 2023
Python

akashe / Multimodal-action-recognition

Star

Code on selecting an action based on multimodal inputs. Here in this case inputs are voice and text.

multimodality multimodal-learning multimodal-deep-learning multimodal-data multimodal-fusion multimodal-action-recognition cross-attention

Updated Jun 7, 2021
Python

amazon-science / gluonmm

Star

A library of transformer models for computer vision and multi-modality research

video computer-vision pytorch transformer multimodality iccv-2021

Updated Sep 7, 2021
Python

Luka0612 / ChineseVLBert

Star

中文领域的多模态Bert

nlp cv multimodality bert multimodal

Updated Mar 24, 2020

firojalam / multimodal_social_media

Star

multimodal social media content (text, image) classification

social-media text-classification image-processing image-classification multimodality keras-tensorflow disaster-response cnn-classification multimodal-deep-learning crisis-informatics tweet-classification crisis-computing

Updated Jun 22, 2022
Python

trislett / TFCE_mediation

Star

Fast regression and mediation analysis of vertex or voxel MRI data with TFCE

Updated Jun 9, 2022
Python

Improve this page

Add a description, image, and links to the multimodality topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the multimodality topic, visit your repo's landing page and select "manage topics."

Learn more