Welcome to Scribd!

VarBase: A Platform For The Storage and Clinical Interpretation of Next Generation Sequencing Data

Uploaded by

0% found this document useful (0 votes)

185 views13 pages

2015 Association for Pathology Informatics presentation on the Yale Department of Laboratory Medicine next generation sequencing software.

Original Title

VarBase: A Platform for the Storage and Clinical Interpretation of Next Generation Sequencing Data

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

2015 Association for Pathology Informatics presentation on the Yale Department of Laboratory Medicine next generation sequencing software.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

185 views13 pages

VarBase: A Platform For The Storage and Clinical Interpretation of Next Generation Sequencing Data

Uploaded by

wadeschulz

2015 Association for Pathology Informatics presentation on the Yale Department of Laboratory Medicine next generation sequencing software.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 13

Search inside document

VarBase: A Platform for the Storage and

Clinical Interpretation of Next

Generation Sequencing Data
Wade L. Schulz, MD, PhD, John G. Howe, PhD, Karl Hager, PhD, Henry M. Rinder, MD
Yale University, Department of Laboratory Medicine

SLIDE 0

The Problem
Next generation sequencing panel brought online for leukemia and
myelodysplastic syndrome, needed interpretive and data
management software
Interpretation efficiency
Patient safety
Turnaround time

SLIDE 1

Project Goals

Integrate annotation information from disparate data silos

Provide interpretation interface
Generate digital and printed reports
Provide robust research tools for ongoing clinical and laboratory
studies

SLIDE 2

The VarBase Platform

Cloud (Kepler)
VarBase - Kepler

Local (Galileo)
Web Interface

Galileo Services

IonReporter
Research
Applications

Internal
Clients

SLIDE 3

Relations vs. Documents: SQL vs NoSQL

SQL/Relational
ACID Compliant
Column-level encryption
Well-known deployment

NoSQL/Document
Dynamic schema
Improved read/write speeds
Easy scaling and redundancy

SLIDE 4

Tool Selection: Public Data Repository (Kepler)

Elasticsearch
Web service wrapper
Administrative import interface

VarBase - Kepler

COSMIC
ClinVar
OMIM
dbSNP

Index updated every 3 months

Web Interface

Galileo Services

IonReporter
Research
Applications

Internal
Clients

SLIDE 5

Tool Selection: Private Data Warehouse (Galileo)

MSSQL + Elasticsearch
Patient data encrypted in SQL
Panel information stored in SQL
Non-demographic information
in SQL+Elasticsearch
Variants in Elasticsearch+Disk

Document database caveat: Most

are not ACID compliant, should
not be used as a primary data
store

SLIDE 6

Tool Selection: Authentication/Authorization

Institutional Active Directory
Role-based authorization
Web application restrictions

VarBase - Kepler

Laboratory personnel
Trainee (Resident/Fellow)
Attending

Web interface restrictions

Patient-based restriction
Data-type restriction

Web Interface

Galileo Services

IonReporter
Research
Applications

Internal
Clients

SLIDE 7

Variants in JSON
{
"chromosome": "chr7",
"position": 148506396,
"type": "snv",
"refAllele": "A",
"altAllele": "C",
"totalReads": 1998,
"forwardReads": 1038,
"forwardRefReads": 524,
"forwardAltReads": 514,
"reverseReads": 960,
"reverseRefReads": 500,
"reverseAltReads": 460,
"refReads": 1024,
"altReads": 974,
"vaf": 48.749,
"variantRegion": "intronic",
"variantEffect": "",
"snvEffect": "A>C",
"gene": "EZH2"

Variant location in genome

Nucleotide change
Sequencing statistics
Variant allele frequency
Variant coding/protein effects

SLIDE 8

Research Integration: Data Visualization (Kibana)

SLIDE 9

System Statistics
Cloud-Based Elasticsearch Cluster
60 million variant annotations
10 million oncology annotations

Local Elasticsearch+MSSQL Instance

>80 specimens + validation specimens

Turnaround time: 1-2 weeks

S L I D E 10

Conclusions
Hybrid data store can efficiently and securely store complex data
types
Cloud-based variant annotation can be integrated into multiple
services and provides auditable interpretation information
Technology agnostic web service interfaces provide easily accessible
data interchange

S L I D E 11

Acknowledgements

Henry Rinder, MD
Alexa Siddon, MD
Richard Torres, MD
Christopher Tormey, MD
Thomas Durant, MD

Molecular Pathology Laboratory

John G. Howe, PhD
Karl Hager, PhD

Laboratory Informatics
Rodion Rathbone, MD
Nathan Price

S L I D E 12

caBIG W3C
Document41 pages
caBIG W3C
Pranjal Singh Tiwari
No ratings yet
2016-12 Hortonworks Road Show - From Acquisition To Insights
Document24 pages
2016-12 Hortonworks Road Show - From Acquisition To Insights
wadeschulz
No ratings yet
2017-04 Enabling Digital Diagnostics
Document21 pages
2017-04 Enabling Digital Diagnostics
wadeschulz
No ratings yet
Intro To OpenClinica
Document27 pages
Intro To OpenClinica
ytroopery
No ratings yet
Developing A Reference Dataset To Accurately Evaluate SA Tools
Document20 pages
Developing A Reference Dataset To Accurately Evaluate SA Tools
api-27294532
No ratings yet
2015 PAG Variant PDF
Document65 pages
2015 PAG Variant PDF
Angela Barrios
No ratings yet
Charles Boicey Stony Brook Medicine R Nusa
Document33 pages
Charles Boicey Stony Brook Medicine R Nusa
vinay kumar
No ratings yet
Patient Record Monitoring System
Document16 pages
Patient Record Monitoring System
Shabbir Ali
No ratings yet
HANDI - Arctic Conf 2014
Document40 pages
HANDI - Arctic Conf 2014
EwanDavis
No ratings yet
Oracle, Mysql and Postgresql DBMS: Comparison of
Document31 pages
Oracle, Mysql and Postgresql DBMS: Comparison of
Be Jhe
No ratings yet
Cloud-Based Assured Information Sharing and Identity Management
Document20 pages
Cloud-Based Assured Information Sharing and Identity Management
Sami Dick
No ratings yet
Ner Api
Document5 pages
Ner Api
Manikandan Sundaram
No ratings yet
Project Titles:: Generic Technology
Document2 pages
Project Titles:: Generic Technology
seravanakumar
No ratings yet
Patient Profiling:: Big Data's Impact On Healthcare
Document25 pages
Patient Profiling:: Big Data's Impact On Healthcare
gegopi
No ratings yet
The Scientific Data Management Center: Arie Shoshani (PI)
Document38 pages
The Scientific Data Management Center: Arie Shoshani (PI)
Anusha Ammu
No ratings yet
CIPRes in Kepler: An Integrative Workflow Package for Streamlining Phylogenetic Data Analyses
Document16 pages
CIPRes in Kepler: An Integrative Workflow Package for Streamlining Phylogenetic Data Analyses
Jover Yoker
No ratings yet
Resume CV JoeJelonek IT Professional Buffalo NY, SQL, Database, Clinical Trials, ASP, C#
Document2 pages
Resume CV JoeJelonek IT Professional Buffalo NY, SQL, Database, Clinical Trials, ASP, C#
JoeJelonek
No ratings yet
Development of Grid Computing Infrastructure
Document42 pages
Development of Grid Computing Infrastructure
gopitheprince
No ratings yet
Peer-To-Peer (P2P) Databases: Chengxiang Zhai
Document90 pages
Peer-To-Peer (P2P) Databases: Chengxiang Zhai
israel_carino
No ratings yet
Rajasthan Technical University, Kota Detailed Syllabus For B.Tech.
Document21 pages
Rajasthan Technical University, Kota Detailed Syllabus For B.Tech.
Dolly Hussain
No ratings yet
Open-Source Digital Archiving for Medical Research
Document17 pages
Open-Source Digital Archiving for Medical Research
mfs core
No ratings yet
2015 08 11 - Clinical LOINC and RELMA Workshop
Document232 pages
2015 08 11 - Clinical LOINC and RELMA Workshop
Daniel Vreeman
No ratings yet
Oracle DBA Session 1: Introduction
Document43 pages
Oracle DBA Session 1: Introduction
John
No ratings yet
The Ideal of LIS
Document13 pages
The Ideal of LIS
kania
No ratings yet
BTech CSE Third Year Syllabus
Document5 pages
BTech CSE Third Year Syllabus
Ankush Kumar
No ratings yet
Encode Portal Update Provides Access to 13,000+ Datasets
Document8 pages
Encode Portal Update Provides Access to 13,000+ Datasets
rcastac
No ratings yet
A Portable Neuroinformatic System in A Neurological Research Environment
Document16 pages
A Portable Neuroinformatic System in A Neurological Research Environment
remenkimi
No ratings yet
Covid Presentation
Document23 pages
Covid Presentation
MTS Technologies
No ratings yet
Full
Document15 pages
Full
Feira Stok22
No ratings yet
Care2x en
Document69 pages
Care2x en
indartoimams
No ratings yet
The in Analysis Databases:: Science
Document33 pages
The in Analysis Databases:: Science
greeen.pat6918
No ratings yet
Clinical text analysis and extraction system cTAKES
Document12 pages
Clinical text analysis and extraction system cTAKES
venkatsrmv
No ratings yet
Big Data Analytics
From Everand
Big Data Analytics
Venkat Ankam
No ratings yet
Guide Clinical Data Warehouse Ar 1563726
Document3 pages
Guide Clinical Data Warehouse Ar 1563726
chan-
No ratings yet
Securing Aggregate Queries for DNA Databases
Document7 pages
Securing Aggregate Queries for DNA Databases
gopi
No ratings yet
Medical Expert Systems Developed in J.MD, A Java Based Expert System Shell Application in Clinical Laboratories
Document5 pages
Medical Expert Systems Developed in J.MD, A Java Based Expert System Shell Application in Clinical Laboratories
Shobhit Chaurasia
No ratings yet
Distributed NoSQL Storage for Extreme-scale System Services Performance
Document45 pages
Distributed NoSQL Storage for Extreme-scale System Services Performance
Balakrishnan.G
No ratings yet
Big Data Professional with 6+ Years of Experience
Document8 pages
Big Data Professional with 6+ Years of Experience
Mirza Mujtaba Baig
No ratings yet
Rest API Best Practices
Document15 pages
Rest API Best Practices
deepak.angrula506
No ratings yet
ArtistDesign Phillips Rome Nov 08
Document19 pages
ArtistDesign Phillips Rome Nov 08
rakesh
No ratings yet
International Journal of Computer Science & Information Security
Document92 pages
International Journal of Computer Science & Information Security
Dhina
No ratings yet
Standard Cell Design and Characterization - DS
Document83 pages
Standard Cell Design and Characterization - DS
Pinjare Sampatrao L
No ratings yet
CS780-3 Lecture Notes: in Courtesy of Mengjun Xie
Document33 pages
CS780-3 Lecture Notes: in Courtesy of Mengjun Xie
PSH PML
No ratings yet
An Integrated Framework For Enhancing The Semantic Transfromation of Relational Databases
Document13 pages
An Integrated Framework For Enhancing The Semantic Transfromation of Relational Databases
Alsayed Algergawy
No ratings yet
Dumitru Roman: Summer School ESWC 2014
Document36 pages
Dumitru Roman: Summer School ESWC 2014
DaPaaS
No ratings yet
Facilities for Craniofacial Research
Document3 pages
Facilities for Craniofacial Research
Anonymous 0KlP4WiDf5
No ratings yet
Indivo iOS Framework
Document36 pages
Indivo iOS Framework
AMIA
No ratings yet
IEEE Conference On Data Mining
Document7 pages
IEEE Conference On Data Mining
ZhaoHui Tang
No ratings yet
IEEE Conference On Data Mining
Document7 pages
IEEE Conference On Data Mining
ZhaoHui Tang
No ratings yet
Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics
Document25 pages
Large Scale Semantic Data Integration And: Analytics Through Cloud: A Case Study in Bioinformatics
arteepu4
No ratings yet
Genomic Database Performance Improvements With Document-Based Database Architecture
Document17 pages
Genomic Database Performance Improvements With Document-Based Database Architecture
wadeschulz
No ratings yet
PHD Thesis Data Warehousing
Document7 pages
PHD Thesis Data Warehousing
Monica Franklin
100% (2)
Data Masters - Datawarehousing in The Cloud
Document47 pages
Data Masters - Datawarehousing in The Cloud
avinashkumarbihari1275
100% (1)
Database Management Blood Bank Applications: Systems For
Document3 pages
Database Management Blood Bank Applications: Systems For
Ash Lynx
No ratings yet
SARP Redcap
Document23 pages
SARP Redcap
Bhavana Alapati
No ratings yet
Blank en Berg Pittsburgh 2011 Ngs
Document59 pages
Blank en Berg Pittsburgh 2011 Ngs
Iria Pérez Iván Lesende
No ratings yet
AJAX PHP Web Application - Diploma I.T Final Year Project Proposal
Document10 pages
AJAX PHP Web Application - Diploma I.T Final Year Project Proposal
Nelson Ameyo
No ratings yet
A Librarian's Guide to Graphs, Data and the Semantic Web
From Everand
A Librarian's Guide to Graphs, Data and the Semantic Web
James Powell
No ratings yet
An Introduction to Healthcare Informatics: Building Data-Driven Tools
From Everand
An Introduction to Healthcare Informatics: Building Data-Driven Tools
Peter Mccaffrey
Rating: 5 out of 5 stars
5/5 (1)
Data Mining Applications with R
From Everand
Data Mining Applications with R
Yanchang Zhao
Rating: 4 out of 5 stars
4/5 (2)
Creating Data Science Workflows - A Healthcare Use Case
Document43 pages
Creating Data Science Workflows - A Healthcare Use Case
wadeschulz
100% (3)
Composable, Petabyte-Scale Genomics Workflows With Docker and Luigi
Document24 pages
Composable, Petabyte-Scale Genomics Workflows With Docker and Luigi
wadeschulz
No ratings yet
The Search For Cancer's Causes and Cures
Document26 pages
The Search For Cancer's Causes and Cures
wadeschulz
No ratings yet
CAP 2016 - Big Data Platform To Manage Genomic Variants
Document1 page
CAP 2016 - Big Data Platform To Manage Genomic Variants
wadeschulz
No ratings yet
Role of Anti-Cyclic Citrullinated Peptide Screening in Patients With Lung Disease But Without Connective Tissue Disorders
Document1 page
Role of Anti-Cyclic Citrullinated Peptide Screening in Patients With Lung Disease But Without Connective Tissue Disorders
wadeschulz
No ratings yet
Transient Myeloproliferative Disorder: What's Eosinophilia Got To Do With It?
Document1 page
Transient Myeloproliferative Disorder: What's Eosinophilia Got To Do With It?
wadeschulz
No ratings yet
Integration of Third Party Genetic Analysis Software Into A Clinical Next Generation Sequencing Data Platform
Document1 page
Integration of Third Party Genetic Analysis Software Into A Clinical Next Generation Sequencing Data Platform
wadeschulz
No ratings yet
Genomic Database Performance Improvements With Document-Based Database Architecture
Document17 pages
Genomic Database Performance Improvements With Document-Based Database Architecture
wadeschulz
No ratings yet
Hempel SDS
Document5 pages
Hempel SDS
Ram TN
0% (1)
DCR 'S-March - 18
Document37 pages
DCR 'S-March - 18
Vidya Budihal
No ratings yet
Novolin and Humulin
Document3 pages
Novolin and Humulin
Chynna
No ratings yet
3 Heart InternetNew
Document55 pages
3 Heart InternetNew
Coral Srinivasa Ramalu
No ratings yet
Slipped Disc Syndrome Explained
Document9 pages
Slipped Disc Syndrome Explained
Andrei Marin
No ratings yet
Cast Metal Inlays - Onlays
Document7 pages
Cast Metal Inlays - Onlays
dent in dentist
No ratings yet
Pulmonary Pharmacology
Document8 pages
Pulmonary Pharmacology
Junam Disimban
No ratings yet
Hla DR Typing
Document5 pages
Hla DR Typing
Jackie De Vries
No ratings yet
Comprehensive Matwork & Reformer: Next Steps
Document1 page
Comprehensive Matwork & Reformer: Next Steps
Jussara Carvalho
No ratings yet
The Gumamela
Document16 pages
The Gumamela
nissamagbago
No ratings yet
Mechanical Low Back Pain: Clinically Relevant Anatomy
Document4 pages
Mechanical Low Back Pain: Clinically Relevant Anatomy
Yashsvi Shinde
No ratings yet
Efektifitas Stretching (Rahmiati)
Document8 pages
Efektifitas Stretching (Rahmiati)
Tengku Eltrikanawati
No ratings yet
Ipgtra Advt 1 2018
Document5 pages
Ipgtra Advt 1 2018
Kirankumar Mutnali
No ratings yet
Polycystic Ovary Syndrome
Document19 pages
Polycystic Ovary Syndrome
Jalal Albadri
No ratings yet
Daftar Permintaan Obat
Document3 pages
Daftar Permintaan Obat
Efhan Salaputa
No ratings yet
Training Programs in LCP
Document6 pages
Training Programs in LCP
Harby
No ratings yet
Catalogo PDF
Document6 pages
Catalogo PDF
rafaelcb3
No ratings yet
RN ScopeofPractice
Document86 pages
RN ScopeofPractice
Ahmad Jamaluddin
No ratings yet
Assessment KD 3.1
Document5 pages
Assessment KD 3.1
Ika Nurjanah
No ratings yet
0 The Mega Brain
Document388 pages
0 The Mega Brain
hwzeee
100% (14)
Physical Assesment For Chickenpox
Document6 pages
Physical Assesment For Chickenpox
Mary Gem Galvan Fesalbon
No ratings yet
Community Diagnosis
Document28 pages
Community Diagnosis
Alexious Marie Callueng
No ratings yet
Basic Jeopardy Template 2003
Document52 pages
Basic Jeopardy Template 2003
api-236914749
No ratings yet
Interventions With Pneumonia
Document2 pages
Interventions With Pneumonia
Anonymous qemC1CybL
No ratings yet
Children, Cell Phones, and Possible Side Effects Final Draft
Document5 pages
Children, Cell Phones, and Possible Side Effects Final Draft
Angela Wentz-Mccann
No ratings yet
Inside Chiropractic
Document275 pages
Inside Chiropractic
Daniel
No ratings yet
Provision of Higher Education Opportunities for Students of Balochistan & FATA
Document2 pages
Provision of Higher Education Opportunities for Students of Balochistan & FATA
Aziz okz
100% (1)
MBBS Pathology Syllabus and Recommended Books
Document3 pages
MBBS Pathology Syllabus and Recommended Books
Rehaab Mohiuddin
No ratings yet
SANKARA COLLEGE OF OPTOMETRY BINOCULAR VISION EXAM
Document2 pages
SANKARA COLLEGE OF OPTOMETRY BINOCULAR VISION EXAM
Diwakar Rao
No ratings yet
2021 Child and Adolescent Clinical Psychopharmacology Made Simple - John D. Preston
Document181 pages
2021 Child and Adolescent Clinical Psychopharmacology Made Simple - John D. Preston
Catalina Walker Alvarez
100% (1)