VIOLIN Logo
VO Banner
Search: for Help
Protegen Home
Introduction
Statistics
News and Updates
Protegen Query
Protegen BLAST
Selected Bacteria
Brucella spp. (26)
B. anthracis (14)
E. coli (40)
M. tuberculosis (26)
N. meningitidis (18)
Selected Viruses
Ebola virus (19)
HIV (41)
Influenza virus (50)
Selected Parasites
Plasmodium (47)
Data Submission
Data Exchange
Data Download
Documentation
FAQs
Disclaimer
Contact Us
UMMS Logo


hap

General Information
Protegen ID 103
VO ID VO_0010917
Taxonomy ID 727
Other Database IDs CDD:280543
CDD:238653
CDD:313027
CDD:214872
Molecule Role Protective antigen
Related Vaccines(s) Nontypeable H. influenzae Hap Protein Vaccine
References  
Gene Information
Gene Name hap
Genbank Accession AF369380
DNA Sequence
>gi|23506943|gb|AF369380.1| Haemophilus influenzae strain TN106 adhesin (hap) gene, partial cds
ATGAAAAAAACTGTATTTCGTCTGAATTTTTTAACCGCTTGCATTTCATTAGGGATAGTATCGCAAGCGT
GGGCAGGTCATACTTATTTTGGGATTGACTACCAATATTATCGTGATTTTGCCGAGAATAAAGGGAAGTT
TACAGTTGGGGCTCAAGATATTGATATCTACAATAAAAAAGGGGAAATGATAGGTACGATGATGAAAGGT
GTGCCTATGCCTGATTTATCTTCCATGGTTCGTGGTGGTTATTCAACATTGATAAGTGAGCAGCATTTAA
TTAGCGTCGCACATAATGTAGGGTATGATGTCGTTGATTTTGGTATGGAGGGGGAAAATCCAGACCAACA
TCGTTTTAAGTATAAAGTTGTTAAACGATATAATTATAAGAGCGGTGATAGACAATATAATGATTATCAA
CATCCAAGATTAGAGAAATTTGTAACGGAAACTGCACCTATTGAAATGGTTTCATATATGGATGGTAATC
ATTACAAAAATTTTAATCAATATCCTTTGCGAGTTAGAGTTGGAAGTGGGCATCAATGGTGGAAAGACGA
TAATAATAAAACCATTGGAGACTTAGCCTATGGAGGTTCATGGTTAATAGGTGGAAATACCTTTGAAGAT
GGACCAGCTGGTAACGGTACATTAGAATTAAATGGGCGAGTACAAAATCCTAATAAATATGGTCCACTAC
CTACGGCAGGTTCATTCGGGGATAGTGGTTCTCCAATGTTTATTTATGATAAGGAAGTTAAGAAATGGTT
ATTAAATGGCGTGTTACGTGAAGGAAATCCTTATGCTGCAGTAGGAAACAGCTATCAAATTACACGAAAA
GATTATTTTCAAGGTATTCTTAATCAAGACATTACAGCTAATTTTTGGGATACTAATGCTGAATATAGAT
TTAATATAGGGAGTGACCACAATGGAAGAGTGGCAACAATCAAAAGTACATTACCTAAAAAAGCTATTCA
GCCTGAACGAATAGTGGGTCTTTATGATAATAGCCAACTTCATGATGCTAGAGATAAAAATGGCGATGAA
TCTCCCTCTTATAAAGGTCCTAATCCATGGTCGCCAGCATTACATCATGGGAAAAGTATTTACTTTGGCG
ATCAAGGAACAGGAACTTTAACAATTGAAAATAATATAAATCAAGGTGCAGGTGGATTGTATTTTGAAGG
TAATTTTGTTGTAAAAGGCAATCAAAATAATATAACTTGGCAAGGTGCAGGCGTTTCTGTTGGAGAAGAA
AGTACTGTTGAATGGCAGGTGCATAATCCAGAAGGCGATCGCTTATCCAAAATTGGGCTGGGAACCTTAC
TTGTTAATGGTAAAGGGAAAAACTTAGGAAGCCTGAGTGTCGGTAACGGTTTGGTTGTGTTAGATCAACA
AGCAGATGAATCAGGTCAAAAACAAGCCTTTAAAGAAGTTGGCATTGTAAGTGGTAGAGCTACCGTTCAA
CTAAATAGTGCAGATCAAGTTGATCCTAACAATATTTATTTCGGCTTTCGTGGTGGTCGCTTAGATCTTA
ATGGGCATTCATTAACCTTTGAACGTATCCAAAATACGGATGAAGGCGCGATGATTGTGAACCACAACGC
TTCTCAAACCGCAAATATTACGATTACAGGCAACGCAACTATTAATTCAGATAGCAAACAACTTACTAAT
AAAAAAGATATTGCATTTAACGGCTGGTTTGGTGAGCAAGATAAAGCTAAAACAAATGGTCGTTTAAATG
TGAATTATCAACCAGTTAATGCAGAAAATCATTTGTTGCTTTCTGGGGGGACAAATTTAAACGGCAATAT
CACGCAAAATGGTGGTACGTTAGTTTTTAGTGGTCGTCCAACGCCTCATGCTTACAATCATTTAAGAAGA
GACTTGTCTAACATGGAAGGTATCCCACAAGGCGAAATTGTGTGGGATCACGATTGGATCAACCGCACAT
TTAAAGCTGAAAACTTCCAAATTAAAGGCGGAAGTGCGGTGGTTTCTCGCAATGTTTCTTCAATTGAGGG
AAATTGGACAGTCAGCAATAATGCAAATGCCACATTTGGTGTTGTGCCAAATCAGCAAAATACCATTTGC
ACGCGTTCAGATTGGACAGGATTAACGACTTGTAAAACAGTTGATTTAACCGATAAAAAAGTTATTAATT
CCATACCGACAACACAAATTAATGGTTCTATTAATTTAACTGATAATGCAACAGTGAATATTCATGGTTT
AGCAAAACTTAATGGTAATGTCACTTTAATAGATCACAGCCAATTTACATTGAGCAACAATGCCACCCAA
ACAGGCAATATCAAACTTTCAAATCACGCAAATGCAACGGTGGACAATGCAAATTTGAACGGTAATGTGA
ATTTAATGGATTCTGCTCAATTTTCTTTAAAAAACAGCCATTTTTCGCACCAAATCCAAGGTGGGGAAGA
CACAACAGTGATGTTGGAAAATGCGACTTGGACAATGCCTAGCGATACCACATTGCAGAATTTAACGCTA
AATAATAGTACTGTTACGTTAAATTCAGCTTATTCAGCTATCTCAAATAATGCGCCACGCCGTCGCCGCC
GTTCATTAGAGACGGAAACAACGCCAACATCGGCAGAACATCGTTTCAACACATTGACAGTAAATGGTAA
ATTGAGCGGGCAAGGCACATTCCAATTTACTTCATCTTTATTTGGCTATAAAAGCGATAAATTAAAATTA
TCCAATGACGCTGAGGGCGATTACACATTATCTGTTCGCAACACAGGCAAAGAACCCGTGACCTTTGGGC
AATTAACTTTGGTTGAAAGCAAAGATAATAAACCGTTATCAGACAAACTCACATTCACGTTAGAAAATGA
CCACGTTGATGCAGGTGCATTACGTTATAAATTAGTGAAGAATGATGGCGAATTCCGCTTACATAACCCA
ATAAAAGAGCAGGAATTGCGCTCTGATTTAGTAAGAGCAGAGCAAGCAGAACGAACATTAGAAGCCAAAC
AAGTTGAACAGACTGCTAAAACACAAACAAGTAAGGCAAGAGTGCGGTCAAGAAGAGCGGTGTTTTCTGA
TCCCCTGCCTGCTCAAAGCCTGTTAAAAGCATTAGAAGCCAAACAAGCTCTGACTACTGAAACACAAACA
AGTAAGGCAAAAAAAGTGCGGTCAAAAAGAGCTGCGAGAGAGTTTTCTGATACCCTGCCTGATCAAATAT
TACAAGCCGCACTTGAGGTTATTGATGCCCAACAGCAAGTGAAAAAAGAACCTCAAACTCAAGAGGAAGA
AGAGAAAAGACAACGCAAACAAAAAGAATTGATCAGCCGTTACTCAAATAGTGCGTTATCGGAGTTGTCT
GCGACAGTAAATAGTATGCTTTCCGTTCAAGATGAATTGGATCGTCTTTTTGTAGATCAAGCACAATCTG
CCGTGTGGACAAATATCGCACAGGATAAAAGACGCTATGATTCTGATGCGTTCCGTGCTTATCAGCAGAA
AACGAACTTGCGTCAAATTGGGGTGCAAAAAGCCTTAGATAATGGACGAATTGGGGCGGTTTTCTCGCAT
AGCCGTTCAGATAATACCTTTGACGAACAGGTTAAAAATCACGCGACATTAGCGATGATGTCGGGTTTTG
CCCAATATCAATGGGGCGATTTACAATTTGGTGTAAACGTGGGTGCGGGAATTAGTGCGAGTAAAATGGC
TGAAGAACAAAGCCGAAAAATTCATCGAAAAGCGATAAATTATGGTGTGAATGCAAGTTATCAGTTCCGT
TTAGGGCAATTGGGTATTCAGCCTTATTTGGGTGTTAATCGATATTTTATTGAACGTGAAAATTATCAAT
CTGAAGAAGTGAAAGTGCAAACACCGAGCCTTGTATTTAATCGCTATAATGCTGGCATTCGAGTTGATTA
TACATTTACCCCGACAGATAATATCAGCATTAAGCCTTATTTCTTCGTCAATTATGTTGATGTTTCAAAC
GCTAACGTACAAACCACTGTAAATCGCACGATGTTGCAACAATCATTTGGGCGTTATTGGCAAAAAGAAG
TGGGATTAAAGGCAGAAATTTTACATTTCCAACTTTCCGCTTTTATCTCAAAATCTCAAGGTTCACAACT
CGGCAAACAGCAAAATGTGGGCGTGAAATTGGGGTATCGTTGG
Protein Information
Protein Name adhesin
NCBI Protein GI 23506944
Protein pI 9.09
Protein Weight 146306.58
Protein Length 1466
Protein Note Immunoglobulin A1 protease; pfam02395
Protein Sequence
>AAN37924.1 adhesin, partial [Haemophilus influenzae]
MKKTVFRLNFLTACISLGIVSQAWAGHTYFGIDYQYYRDFAENKGKFTVGAQDIDIYNKKGEMIGTMMKG
VPMPDLSSMVRGGYSTLISEQHLISVAHNVGYDVVDFGMEGENPDQHRFKYKVVKRYNYKSGDRQYNDYQ
HPRLEKFVTETAPIEMVSYMDGNHYKNFNQYPLRVRVGSGHQWWKDDNNKTIGDLAYGGSWLIGGNTFED
GPAGNGTLELNGRVQNPNKYGPLPTAGSFGDSGSPMFIYDKEVKKWLLNGVLREGNPYAAVGNSYQITRK
DYFQGILNQDITANFWDTNAEYRFNIGSDHNGRVATIKSTLPKKAIQPERIVGLYDNSQLHDARDKNGDE
SPSYKGPNPWSPALHHGKSIYFGDQGTGTLTIENNINQGAGGLYFEGNFVVKGNQNNITWQGAGVSVGEE
STVEWQVHNPEGDRLSKIGLGTLLVNGKGKNLGSLSVGNGLVVLDQQADESGQKQAFKEVGIVSGRATVQ
LNSADQVDPNNIYFGFRGGRLDLNGHSLTFERIQNTDEGAMIVNHNASQTANITITGNATINSDSKQLTN
KKDIAFNGWFGEQDKAKTNGRLNVNYQPVNAENHLLLSGGTNLNGNITQNGGTLVFSGRPTPHAYNHLRR
DLSNMEGIPQGEIVWDHDWINRTFKAENFQIKGGSAVVSRNVSSIEGNWTVSNNANATFGVVPNQQNTIC
TRSDWTGLTTCKTVDLTDKKVINSIPTTQINGSINLTDNATVNIHGLAKLNGNVTLIDHSQFTLSNNATQ
TGNIKLSNHANATVDNANLNGNVNLMDSAQFSLKNSHFSHQIQGGEDTTVMLENATWTMPSDTTLQNLTL
NNSTVTLNSAYSAISNNAPRRRRRSLETETTPTSAEHRFNTLTVNGKLSGQGTFQFTSSLFGYKSDKLKL
SNDAEGDYTLSVRNTGKEPVTFGQLTLVESKDNKPLSDKLTFTLENDHVDAGALRYKLVKNDGEFRLHNP
IKEQELRSDLVRAEQAERTLEAKQVEQTAKTQTSKARVRSRRAVFSDPLPAQSLLKALEAKQALTTETQT
SKAKKVRSKRAAREFSDTLPDQILQAALEVIDAQQQVKKEPQTQEEEEKRQRKQKELISRYSNSALSELS
ATVNSMLSVQDELDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQKTNLRQIGVQKALDNGRIGAVFSH
SRSDNTFDEQVKNHATLAMMSGFAQYQWGDLQFGVNVGAGISASKMAEEQSRKIHRKAINYGVNASYQFR
LGQLGIQPYLGVNRYFIERENYQSEEVKVQTPSLVFNRYNAGIRVDYTFTPTDNISIKPYFFVNYVDVSN
ANVQTTVNRTMLQQSFGRYWQKEVGLKAEILHFQLSAFISKSQGSQLGKQQNVGVKLGYRW
Epitope Information
IEDB Linear Epitope