hap |
| General Information |
| Protegen ID |
103 |
|
VO ID |
VO_0010917
|
|
Taxonomy ID |
727
|
|
Other Database IDs |
CDD:280543 CDD:238653 CDD:313027 CDD:214872 |
|
Molecule Role |
Protective antigen |
| Related Vaccines(s) |
Nontypeable H. influenzae Hap Protein Vaccine
|
| References |
|
| Gene Information |
|
Gene Name |
hap |
|
Genbank Accession |
AF369380 |
|
DNA Sequence |
>gi|23506943|gb|AF369380.1| Haemophilus influenzae strain TN106 adhesin (hap) gene, partial cds
ATGAAAAAAACTGTATTTCGTCTGAATTTTTTAACCGCTTGCATTTCATTAGGGATAGTATCGCAAGCGT
GGGCAGGTCATACTTATTTTGGGATTGACTACCAATATTATCGTGATTTTGCCGAGAATAAAGGGAAGTT
TACAGTTGGGGCTCAAGATATTGATATCTACAATAAAAAAGGGGAAATGATAGGTACGATGATGAAAGGT
GTGCCTATGCCTGATTTATCTTCCATGGTTCGTGGTGGTTATTCAACATTGATAAGTGAGCAGCATTTAA
TTAGCGTCGCACATAATGTAGGGTATGATGTCGTTGATTTTGGTATGGAGGGGGAAAATCCAGACCAACA
TCGTTTTAAGTATAAAGTTGTTAAACGATATAATTATAAGAGCGGTGATAGACAATATAATGATTATCAA
CATCCAAGATTAGAGAAATTTGTAACGGAAACTGCACCTATTGAAATGGTTTCATATATGGATGGTAATC
ATTACAAAAATTTTAATCAATATCCTTTGCGAGTTAGAGTTGGAAGTGGGCATCAATGGTGGAAAGACGA
TAATAATAAAACCATTGGAGACTTAGCCTATGGAGGTTCATGGTTAATAGGTGGAAATACCTTTGAAGAT
GGACCAGCTGGTAACGGTACATTAGAATTAAATGGGCGAGTACAAAATCCTAATAAATATGGTCCACTAC
CTACGGCAGGTTCATTCGGGGATAGTGGTTCTCCAATGTTTATTTATGATAAGGAAGTTAAGAAATGGTT
ATTAAATGGCGTGTTACGTGAAGGAAATCCTTATGCTGCAGTAGGAAACAGCTATCAAATTACACGAAAA
GATTATTTTCAAGGTATTCTTAATCAAGACATTACAGCTAATTTTTGGGATACTAATGCTGAATATAGAT
TTAATATAGGGAGTGACCACAATGGAAGAGTGGCAACAATCAAAAGTACATTACCTAAAAAAGCTATTCA
GCCTGAACGAATAGTGGGTCTTTATGATAATAGCCAACTTCATGATGCTAGAGATAAAAATGGCGATGAA
TCTCCCTCTTATAAAGGTCCTAATCCATGGTCGCCAGCATTACATCATGGGAAAAGTATTTACTTTGGCG
ATCAAGGAACAGGAACTTTAACAATTGAAAATAATATAAATCAAGGTGCAGGTGGATTGTATTTTGAAGG
TAATTTTGTTGTAAAAGGCAATCAAAATAATATAACTTGGCAAGGTGCAGGCGTTTCTGTTGGAGAAGAA
AGTACTGTTGAATGGCAGGTGCATAATCCAGAAGGCGATCGCTTATCCAAAATTGGGCTGGGAACCTTAC
TTGTTAATGGTAAAGGGAAAAACTTAGGAAGCCTGAGTGTCGGTAACGGTTTGGTTGTGTTAGATCAACA
AGCAGATGAATCAGGTCAAAAACAAGCCTTTAAAGAAGTTGGCATTGTAAGTGGTAGAGCTACCGTTCAA
CTAAATAGTGCAGATCAAGTTGATCCTAACAATATTTATTTCGGCTTTCGTGGTGGTCGCTTAGATCTTA
ATGGGCATTCATTAACCTTTGAACGTATCCAAAATACGGATGAAGGCGCGATGATTGTGAACCACAACGC
TTCTCAAACCGCAAATATTACGATTACAGGCAACGCAACTATTAATTCAGATAGCAAACAACTTACTAAT
AAAAAAGATATTGCATTTAACGGCTGGTTTGGTGAGCAAGATAAAGCTAAAACAAATGGTCGTTTAAATG
TGAATTATCAACCAGTTAATGCAGAAAATCATTTGTTGCTTTCTGGGGGGACAAATTTAAACGGCAATAT
CACGCAAAATGGTGGTACGTTAGTTTTTAGTGGTCGTCCAACGCCTCATGCTTACAATCATTTAAGAAGA
GACTTGTCTAACATGGAAGGTATCCCACAAGGCGAAATTGTGTGGGATCACGATTGGATCAACCGCACAT
TTAAAGCTGAAAACTTCCAAATTAAAGGCGGAAGTGCGGTGGTTTCTCGCAATGTTTCTTCAATTGAGGG
AAATTGGACAGTCAGCAATAATGCAAATGCCACATTTGGTGTTGTGCCAAATCAGCAAAATACCATTTGC
ACGCGTTCAGATTGGACAGGATTAACGACTTGTAAAACAGTTGATTTAACCGATAAAAAAGTTATTAATT
CCATACCGACAACACAAATTAATGGTTCTATTAATTTAACTGATAATGCAACAGTGAATATTCATGGTTT
AGCAAAACTTAATGGTAATGTCACTTTAATAGATCACAGCCAATTTACATTGAGCAACAATGCCACCCAA
ACAGGCAATATCAAACTTTCAAATCACGCAAATGCAACGGTGGACAATGCAAATTTGAACGGTAATGTGA
ATTTAATGGATTCTGCTCAATTTTCTTTAAAAAACAGCCATTTTTCGCACCAAATCCAAGGTGGGGAAGA
CACAACAGTGATGTTGGAAAATGCGACTTGGACAATGCCTAGCGATACCACATTGCAGAATTTAACGCTA
AATAATAGTACTGTTACGTTAAATTCAGCTTATTCAGCTATCTCAAATAATGCGCCACGCCGTCGCCGCC
GTTCATTAGAGACGGAAACAACGCCAACATCGGCAGAACATCGTTTCAACACATTGACAGTAAATGGTAA
ATTGAGCGGGCAAGGCACATTCCAATTTACTTCATCTTTATTTGGCTATAAAAGCGATAAATTAAAATTA
TCCAATGACGCTGAGGGCGATTACACATTATCTGTTCGCAACACAGGCAAAGAACCCGTGACCTTTGGGC
AATTAACTTTGGTTGAAAGCAAAGATAATAAACCGTTATCAGACAAACTCACATTCACGTTAGAAAATGA
CCACGTTGATGCAGGTGCATTACGTTATAAATTAGTGAAGAATGATGGCGAATTCCGCTTACATAACCCA
ATAAAAGAGCAGGAATTGCGCTCTGATTTAGTAAGAGCAGAGCAAGCAGAACGAACATTAGAAGCCAAAC
AAGTTGAACAGACTGCTAAAACACAAACAAGTAAGGCAAGAGTGCGGTCAAGAAGAGCGGTGTTTTCTGA
TCCCCTGCCTGCTCAAAGCCTGTTAAAAGCATTAGAAGCCAAACAAGCTCTGACTACTGAAACACAAACA
AGTAAGGCAAAAAAAGTGCGGTCAAAAAGAGCTGCGAGAGAGTTTTCTGATACCCTGCCTGATCAAATAT
TACAAGCCGCACTTGAGGTTATTGATGCCCAACAGCAAGTGAAAAAAGAACCTCAAACTCAAGAGGAAGA
AGAGAAAAGACAACGCAAACAAAAAGAATTGATCAGCCGTTACTCAAATAGTGCGTTATCGGAGTTGTCT
GCGACAGTAAATAGTATGCTTTCCGTTCAAGATGAATTGGATCGTCTTTTTGTAGATCAAGCACAATCTG
CCGTGTGGACAAATATCGCACAGGATAAAAGACGCTATGATTCTGATGCGTTCCGTGCTTATCAGCAGAA
AACGAACTTGCGTCAAATTGGGGTGCAAAAAGCCTTAGATAATGGACGAATTGGGGCGGTTTTCTCGCAT
AGCCGTTCAGATAATACCTTTGACGAACAGGTTAAAAATCACGCGACATTAGCGATGATGTCGGGTTTTG
CCCAATATCAATGGGGCGATTTACAATTTGGTGTAAACGTGGGTGCGGGAATTAGTGCGAGTAAAATGGC
TGAAGAACAAAGCCGAAAAATTCATCGAAAAGCGATAAATTATGGTGTGAATGCAAGTTATCAGTTCCGT
TTAGGGCAATTGGGTATTCAGCCTTATTTGGGTGTTAATCGATATTTTATTGAACGTGAAAATTATCAAT
CTGAAGAAGTGAAAGTGCAAACACCGAGCCTTGTATTTAATCGCTATAATGCTGGCATTCGAGTTGATTA
TACATTTACCCCGACAGATAATATCAGCATTAAGCCTTATTTCTTCGTCAATTATGTTGATGTTTCAAAC
GCTAACGTACAAACCACTGTAAATCGCACGATGTTGCAACAATCATTTGGGCGTTATTGGCAAAAAGAAG
TGGGATTAAAGGCAGAAATTTTACATTTCCAACTTTCCGCTTTTATCTCAAAATCTCAAGGTTCACAACT
CGGCAAACAGCAAAATGTGGGCGTGAAATTGGGGTATCGTTGG
|
| Protein Information |
|
Protein Name |
adhesin |
|
NCBI Protein GI |
23506944
|
|
Protein pI |
9.09 |
|
Protein Weight |
146306.58 |
|
Protein Length |
1466 |
|
Protein Note |
Immunoglobulin A1 protease; pfam02395 |
|
Protein Sequence |
>AAN37924.1 adhesin, partial [Haemophilus influenzae]
MKKTVFRLNFLTACISLGIVSQAWAGHTYFGIDYQYYRDFAENKGKFTVGAQDIDIYNKKGEMIGTMMKG
VPMPDLSSMVRGGYSTLISEQHLISVAHNVGYDVVDFGMEGENPDQHRFKYKVVKRYNYKSGDRQYNDYQ
HPRLEKFVTETAPIEMVSYMDGNHYKNFNQYPLRVRVGSGHQWWKDDNNKTIGDLAYGGSWLIGGNTFED
GPAGNGTLELNGRVQNPNKYGPLPTAGSFGDSGSPMFIYDKEVKKWLLNGVLREGNPYAAVGNSYQITRK
DYFQGILNQDITANFWDTNAEYRFNIGSDHNGRVATIKSTLPKKAIQPERIVGLYDNSQLHDARDKNGDE
SPSYKGPNPWSPALHHGKSIYFGDQGTGTLTIENNINQGAGGLYFEGNFVVKGNQNNITWQGAGVSVGEE
STVEWQVHNPEGDRLSKIGLGTLLVNGKGKNLGSLSVGNGLVVLDQQADESGQKQAFKEVGIVSGRATVQ
LNSADQVDPNNIYFGFRGGRLDLNGHSLTFERIQNTDEGAMIVNHNASQTANITITGNATINSDSKQLTN
KKDIAFNGWFGEQDKAKTNGRLNVNYQPVNAENHLLLSGGTNLNGNITQNGGTLVFSGRPTPHAYNHLRR
DLSNMEGIPQGEIVWDHDWINRTFKAENFQIKGGSAVVSRNVSSIEGNWTVSNNANATFGVVPNQQNTIC
TRSDWTGLTTCKTVDLTDKKVINSIPTTQINGSINLTDNATVNIHGLAKLNGNVTLIDHSQFTLSNNATQ
TGNIKLSNHANATVDNANLNGNVNLMDSAQFSLKNSHFSHQIQGGEDTTVMLENATWTMPSDTTLQNLTL
NNSTVTLNSAYSAISNNAPRRRRRSLETETTPTSAEHRFNTLTVNGKLSGQGTFQFTSSLFGYKSDKLKL
SNDAEGDYTLSVRNTGKEPVTFGQLTLVESKDNKPLSDKLTFTLENDHVDAGALRYKLVKNDGEFRLHNP
IKEQELRSDLVRAEQAERTLEAKQVEQTAKTQTSKARVRSRRAVFSDPLPAQSLLKALEAKQALTTETQT
SKAKKVRSKRAAREFSDTLPDQILQAALEVIDAQQQVKKEPQTQEEEEKRQRKQKELISRYSNSALSELS
ATVNSMLSVQDELDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQKTNLRQIGVQKALDNGRIGAVFSH
SRSDNTFDEQVKNHATLAMMSGFAQYQWGDLQFGVNVGAGISASKMAEEQSRKIHRKAINYGVNASYQFR
LGQLGIQPYLGVNRYFIERENYQSEEVKVQTPSLVFNRYNAGIRVDYTFTPTDNISIKPYFFVNYVDVSN
ANVQTTVNRTMLQQSFGRYWQKEVGLKAEILHFQLSAFISKSQGSQLGKQQNVGVKLGYRW
|
| Epitope Information |
| IEDB Linear Epitope |
|
| IEDB ID |
Epitope |
MHC restriction |
Starting position |
Ending position |
| IEDB ID |
Epitope |
Starting position |
Ending position |
|
|
|
MKKTVFRLNFLTACISLGIVSQAWAGHTYFGIDYQYYRDFAENKGKFTVGAQDIDIYNKKGEMIGTMMKGVPMPDLSSMVRGGYSTLISEQHLISVAHNVGYDVVDFGMEGENPDQHRFKYKVVKRYNYKSGDRQYNDYQHPRLEKFVTETAPIEMVSYMDGNHYKNFNQYPLRVRVGSGHQWWKDDNNKTIGDLAYGGSWLIGGNTFEDGPAGNGTLELNGRVQNPNKYGPLPTAGSFGDSGSPMFIYDKEVKKWLLNGVLREGNPYAAVGNSYQITRKDYFQGILNQDITANFWDTNAEYRFNIGSDHNGRVATIKSTLPKKAIQPERIVGLYDNSQLHDARDKNGDESPSYKGPNPWSPALHHGKSIYFGDQGTGTLTIENNINQGAGGLYFEGNFVVKGNQNNITWQGAGVSVGEESTVEWQVHNPEGDRLSKIGLGTLLVNGKGKNLGSLSVGNGLVVLDQQADESGQKQAFKEVGIVSGRATVQLNSADQVDPNNIYFGFRGGRLDLNGHSLTFERIQNTDEGAMIVNHNASQTANITITGNATINSDSKQLTNKKDIAFNGWFGEQDKAKTNGRLNVNYQPVNAENHLLLSGGTNLNGNITQNGGTLVFSGRPTPHAYNHLRRDLSNMEGIPQGEIVWDHDWINRTFKAENFQIKGGSAVVSRNVSSIEGNWTVSNNANATFGVVPNQQNTICTRSDWTGLTTCKTVDLTDKKVINSIPTTQINGSINLTDNATVNIHGLAKLNGNVTLIDHSQFTLSNNATQTGNIKLSNHANATVDNANLNGNVNLMDSAQFSLKNSHFSHQIQGGEDTTVMLENATWTMPSDTTLQNLTLNNSTVTLNSAYSAISNNAPRRRRRSLETETTPTSAEHRFNTLTVNGKLSGQGTFQFTSSLFGYKSDKLKLSNDAEGDYTLSVRNTGKEPVTFGQLTLVESKDNKPLSDKLTFTLENDHVDAGALRYKLVKNDGEFRLHNPIKEQELRSDLVRAEQAERTLEAKQVEQTAKTQTSKARVRSRRAVFSDPLPAQSLLKALEAKQALTTETQTSKAKKVRSKRAAREFSDTLPDQILQAALEVIDAQQQVKKEPQTQEEEEKRQRKQKELISRYSNSALSELSATVNSMLSVQDELDRLFVDQAQSAVWTNIAQDKRRYDSDAFRAYQQKTNLRQIGVQKALDNGRIGAVFSHSRSDNTFDEQVKNHATLAMMSGFAQYQWGDLQFGVNVGAGISASKMAEEQSRKIHRKAINYGVNASYQFRLGQLGIQPYLGVNRYFIERENYQSEEVKVQTPSLVFNRYNAGIRVDYTFTPTDNISIKPYFFVNYVDVSNANVQTTVNRTMLQQSFGRYWQKEVGLKAEILHFQLSAFISKSQGSQLGKQQNVGVKLGYRW
|