VIOLIN: Vaccine Investigation and Online Information Network

hap

General Information

Protegen ID

103

VO ID

VO_0010917

Taxonomy ID

727

Other Database IDs

CDD:280543
CDD:238653
CDD:313027
CDD:214872

Molecule Role

Protective antigen

Related Vaccines(s)

Nontypeable H. influenzae Hap Protein Vaccine

References

Gene Information

Gene Name

hap

Genbank Accession

AF369380

DNA Sequence

>gi|23506943|gb|AF369380.1| Haemophilus influenzae strain TN106 adhesin (hap) gene, partial cds
ATGAAAAAAACTGTATTTCGTCTGAATTTTTTAACCGCTTGCATTTCATTAGGGATAGTATCGCAAGCGT
GGGCAGGTCATACTTATTTTGGGATTGACTACCAATATTATCGTGATTTTGCCGAGAATAAAGGGAAGTT
TACAGTTGGGGCTCAAGATATTGATATCTACAATAAAAAAGGGGAAATGATAGGTACGATGATGAAAGGT
GTGCCTATGCCTGATTTATCTTCCATGGTTCGTGGTGGTTATTCAACATTGATAAGTGAGCAGCATTTAA
TTAGCGTCGCACATAATGTAGGGTATGATGTCGTTGATTTTGGTATGGAGGGGGAAAATCCAGACCAACA
TCGTTTTAAGTATAAAGTTGTTAAACGATATAATTATAAGAGCGGTGATAGACAATATAATGATTATCAA
CATCCAAGATTAGAGAAATTTGTAACGGAAACTGCACCTATTGAAATGGTTTCATATATGGATGGTAATC
ATTACAAAAATTTTAATCAATATCCTTTGCGAGTTAGAGTTGGAAGTGGGCATCAATGGTGGAAAGACGA
TAATAATAAAACCATTGGAGACTTAGCCTATGGAGGTTCATGGTTAATAGGTGGAAATACCTTTGAAGAT
GGACCAGCTGGTAACGGTACATTAGAATTAAATGGGCGAGTACAAAATCCTAATAAATATGGTCCACTAC
CTACGGCAGGTTCATTCGGGGATAGTGGTTCTCCAATGTTTATTTATGATAAGGAAGTTAAGAAATGGTT
ATTAAATGGCGTGTTACGTGAAGGAAATCCTTATGCTGCAGTAGGAAACAGCTATCAAATTACACGAAAA
GATTATTTTCAAGGTATTCTTAATCAAGACATTACAGCTAATTTTTGGGATACTAATGCTGAATATAGAT
TTAATATAGGGAGTGACCACAATGGAAGAGTGGCAACAATCAAAAGTACATTACCTAAAAAAGCTATTCA
GCCTGAACGAATAGTGGGTCTTTATGATAATAGCCAACTTCATGATGCTAGAGATAAAAATGGCGATGAA
TCTCCCTCTTATAAAGGTCCTAATCCATGGTCGCCAGCATTACATCATGGGAAAAGTATTTACTTTGGCG
ATCAAGGAACAGGAACTTTAACAATTGAAAATAATATAAATCAAGGTGCAGGTGGATTGTATTTTGAAGG
TAATTTTGTTGTAAAAGGCAATCAAAATAATATAACTTGGCAAGGTGCAGGCGTTTCTGTTGGAGAAGAA
AGTACTGTTGAATGGCAGGTGCATAATCCAGAAGGCGATCGCTTATCCAAAATTGGGCTGGGAACCTTAC
TTGTTAATGGTAAAGGGAAAAACTTAGGAAGCCTGAGTGTCGGTAACGGTTTGGTTGTGTTAGATCAACA
AGCAGATGAATCAGGTCAAAAACAAGCCTTTAAAGAAGTTGGCATTGTAAGTGGTAGAGCTACCGTTCAA
CTAAATAGTGCAGATCAAGTTGATCCTAACAATATTTATTTCGGCTTTCGTGGTGGTCGCTTAGATCTTA
ATGGGCATTCATTAACCTTTGAACGTATCCAAAATACGGATGAAGGCGCGATGATTGTGAACCACAACGC
TTCTCAAACCGCAAATATTACGATTACAGGCAACGCAACTATTAATTCAGATAGCAAACAACTTACTAAT
AAAAAAGATATTGCATTTAACGGCTGGTTTGGTGAGCAAGATAAAGCTAAAACAAATGGTCGTTTAAATG
TGAATTATCAACCAGTTAATGCAGAAAATCATTTGTTGCTTTCTGGGGGGACAAATTTAAACGGCAATAT
CACGCAAAATGGTGGTACGTTAGTTTTTAGTGGTCGTCCAACGCCTCATGCTTACAATCATTTAAGAAGA
GACTTGTCTAACATGGAAGGTATCCCACAAGGCGAAATTGTGTGGGATCACGATTGGATCAACCGCACAT
TTAAAGCTGAAAACTTCCAAATTAAAGGCGGAAGTGCGGTGGTTTCTCGCAATGTTTCTTCAATTGAGGG
AAATTGGACAGTCAGCAATAATGCAAATGCCACATTTGGTGTTGTGCCAAATCAGCAAAATACCATTTGC
ACGCGTTCAGATTGGACAGGATTAACGACTTGTAAAACAGTTGATTTAACCGATAAAAAAGTTATTAATT
CCATACCGACAACACAAATTAATGGTTCTATTAATTTAACTGATAATGCAACAGTGAATATTCATGGTTT
AGCAAAACTTAATGGTAATGTCACTTTAATAGATCACAGCCAATTTACATTGAGCAACAATGCCACCCAA
ACAGGCAATATCAAACTTTCAAATCACGCAAATGCAACGGTGGACAATGCAAATTTGAACGGTAATGTGA
ATTTAATGGATTCTGCTCAATTTTCTTTAAAAAACAGCCATTTTTCGCACCAAATCCAAGGTGGGGAAGA
CACAACAGTGATGTTGGAAAATGCGACTTGGACAATGCCTAGCGATACCACATTGCAGAATTTAACGCTA
AATAATAGTACTGTTACGTTAAATTCAGCTTATTCAGCTATCTCAAATAATGCGCCACGCCGTCGCCGCC
GTTCATTAGAGACGGAAACAACGCCAACATCGGCAGAACATCGTTTCAACACATTGACAGTAAATGGTAA
ATTGAGCGGGCAAGGCACATTCCAATTTACTTCATCTTTATTTGGCTATAAAAGCGATAAATTAAAATTA
TCCAATGACGCTGAGGGCGATTACACATTATCTGTTCGCAACACAGGCAAAGAACCCGTGACCTTTGGGC
AATTAACTTTGGTTGAAAGCAAAGATAATAAACCGTTATCAGACAAACTCACATTCACGTTAGAAAATGA
CCACGTTGATGCAGGTGCATTACGTTATAAATTAGTGAAGAATGATGGCGAATTCCGCTTACATAACCCA
ATAAAAGAGCAGGAATTGCGCTCTGATTTAGTAAGAGCAGAGCAAGCAGAACGAACATTAGAAGCCAAAC
AAGTTGAACAGACTGCTAAAACACAAACAAGTAAGGCAAGAGTGCGGTCAAGAAGAGCGGTGTTTTCTGA
TCCCCTGCCTGCTCAAAGCCTGTTAAAAGCATTAGAAGCCAAACAAGCTCTGACTACTGAAACACAAACA
AGTAAGGCAAAAAAAGTGCGGTCAAAAAGAGCTGCGAGAGAGTTTTCTGATACCCTGCCTGATCAAATAT
TACAAGCCGCACTTGAGGTTATTGATGCCCAACAGCAAGTGAAAAAAGAACCTCAAACTCAAGAGGAAGA
AGAGAAAAGACAACGCAAACAAAAAGAATTGATCAGCCGTTACTCAAATAGTGCGTTATCGGAGTTGTCT
GCGACAGTAAATAGTATGCTTTCCGTTCAAGATGAATTGGATCGTCTTTTTGTAGATCAAGCACAATCTG
CCGTGTGGACAAATATCGCACAGGATAAAAGACGCTATGATTCTGATGCGTTCCGTGCTTATCAGCAGAA
AACGAACTTGCGTCAAATTGGGGTGCAAAAAGCCTTAGATAATGGACGAATTGGGGCGGTTTTCTCGCAT
AGCCGTTCAGATAATACCTTTGACGAACAGGTTAAAAATCACGCGACATTAGCGATGATGTCGGGTTTTG
CCCAATATCAATGGGGCGATTTACAATTTGGTGTAAACGTGGGTGCGGGAATTAGTGCGAGTAAAATGGC
TGAAGAACAAAGCCGAAAAATTCATCGAAAAGCGATAAATTATGGTGTGAATGCAAGTTATCAGTTCCGT
TTAGGGCAATTGGGTATTCAGCCTTATTTGGGTGTTAATCGATATTTTATTGAACGTGAAAATTATCAAT
CTGAAGAAGTGAAAGTGCAAACACCGAGCCTTGTATTTAATCGCTATAATGCTGGCATTCGAGTTGATTA
TACATTTACCCCGACAGATAATATCAGCATTAAGCCTTATTTCTTCGTCAATTATGTTGATGTTTCAAAC
GCTAACGTACAAACCACTGTAAATCGCACGATGTTGCAACAATCATTTGGGCGTTATTGGCAAAAAGAAG
TGGGATTAAAGGCAGAAATTTTACATTTCCAACTTTCCGCTTTTATCTCAAAATCTCAAGGTTCACAACT
CGGCAAACAGCAAAATGTGGGCGTGAAATTGGGGTATCGTTGG

Protein Information

Protein Name

adhesin

NCBI Protein GI

23506944

Protein pI

9.09

Protein Weight

146306.58

Protein Length

1466

Protein Note

Immunoglobulin A1 protease; pfam02395

Protein Sequence

>AAN37924.1 adhesin, partial [Haemophilus influenzae]
MKKTVFRLNFLTACISLGIVSQAWAGHTYFGIDYQYYRDFAENKGKFTVGAQDIDIYNKKGEMIGTMMKG
VPMPDLSSMVRGGYSTLISEQHLISVAHNVGYDVVDFGMEGENPDQHRFKYKVVKRYNYKSGDRQYNDYQ
HPRLEKFVTETAPIEMVSYMDGNHYKNFNQYPLRVRVGSGHQWWKDDNNKTIGDLAYGGSWLIGGNTFED
GPAGNGTLELNGRVQNPNKYGPLPTAGSFGDSGSPMFIYDKEVKKWLLNGVLREGNPYAAVGNSYQITRK
DYFQGILNQDITANFWDTNAEYRFNIGSDHNGRVATIKSTLPKKAIQPERIVGLYDNSQLHDARDKNGDE
SPSYKGPNPWSPALHHGKSIYFGDQGTGTLTIENNINQGAGGLYFEGNFVVKGNQNNITWQGAGVSVGEE
STVEWQVHNPEGDRLSKIGLGTLLVNGKGKNLGSLSVGNGLVVLDQQADESGQKQAFKEVGIVSGRATVQ
LNSADQVDPNNIYFGFRGGRLDLNGHSLTFERIQNTDEGAMIVNHNASQTANITITGNATINSDSKQLTN
KKDIAFNGWFGEQDKAKTNGRLNVNYQPVNAENHLLLSGGTNLNGNITQNGGTLVFSGRPTPHAYNHLRR
DLSNMEGIPQGEIVWDHDWINRTFKAENFQIKGGSAVVSRNVSSIEGNWTVSNNANATFGVVPNQQNTIC
TRSDWTGLTTCKTVDLTDKKVINSIPTTQINGSINLTDNATVNIHGLAKLNGNVTLIDHSQFTLSNNATQ
TGNIKLSNHANATVDNANLNGNVNLMDSAQFSLKNSHFSHQIQGGEDTTVMLENATWTMPSDTTLQNLTL
NNSTVTLNSAYSAISNNAPRRRRRSLETETTPTSAEHRFNTLTVNGKLSGQGTFQFTSSLFGYKSDKLKL
SNDAEGDYTLSVRNTGKEPVTFGQLTLVESKDNKPLSDKLTFTLENDHVDAGALRYKLVKNDGEFRLHNP
IKEQELRSDLVRAEQAERTLEAKQVEQTAKTQTSKARVRSRRAVFSDPLPAQSLLKALEAKQALTTETQT
SKAKKVRSKRAAREFSDTLPDQILQAALEVIDAQQQVKKEPQTQEEEEKRQRKQKELISRYSNSALSELS
ATVNSMLSVQDELDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQKTNLRQIGVQKALDNGRIGAVFSH
SRSDNTFDEQVKNHATLAMMSGFAQYQWGDLQFGVNVGAGISASKMAEEQSRKIHRKAINYGVNASYQFR
LGQLGIQPYLGVNRYFIERENYQSEEVKVQTPSLVFNRYNAGIRVDYTFTPTDNISIKPYFFVNYVDVSN
ANVQTTVNRTMLQQSFGRYWQKEVGLKAEILHFQLSAFISKSQGSQLGKQQNVGVKLGYRW

Epitope Information

IEDB Linear Epitope