Baselight

Protein Secondary Sequence

ccPDB - Dataset for prediction protein secondary structure

@kaggle.tamzidhasan_protein_secondary_sequence

Pdb 31–12–2012
@kaggle.tamzidhasan_protein_secondary_sequence.pdb_31_12_2012

  • 2.37 MB
  • 5877 rows
  • 5 columns
unnamed_0

Unnamed: 0

pdb_id

Pdb Id

seq

Seq

sst3

Sst3

sst8

Sst8

1a0gAGYTLWNDQIVKDEEVKIDKEDRGYQFGDGVYEVVKVYNGEMFTVNEHIDRLYASAEKIRITIPYTKDKFHQLLHELVEKNELNTGHIYFQVTRGTSPRAHQFPENTVKPVIIGYTKENPRPLENLEKGVKATFVEDIRWLRCDIKSLNLLGAVLAKQEAHEKGCYEAILHRNNTVTEGSSSNVFGIKDGILYTHPANNMIAKGITRDVVIACANEINMPVKEIPFTTHEALKMDELFVTSTTSEITPVIEIDGKLIRDGKVGEWTRKLQKQFETKIPKPLCEEEECCEEEEHHHCCECCCEHHHHHCCEEEEEEEEECCEECCHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHCCCCEEEEEEEECCECCCCCCCCCCCCCCEEEEEEEECCCCHHHHHHCEEEEEEECCCCCCCCCCECCCHHHHHHHHHHHHCCCCEEEEEECCEEEEECCCEEEEEECCEEECCCCCCCCCCCHHHHHHHHHHHHCCCCEECCCCEHHHHCCCCEEEEEECCCEEEEEEEECCEECCCCCCCHHHHHHHHHHHCCCCCCCCEEEETTEEEEGGGCCBCTTBHHHHHCCEEEEEEEEETTEETTHHHHHHHHHHHHHHTTCCCSSCHHHHHHHHHHHHHHHTCSSEEEEEEEECCBCSSCSSCCCTTSCCEEEEEEEECCCCHHHHHHCEEEEEEECCCCSCTTSCBSCCHHHHHHHHHHHHTTCSEEEEEETTEEEEESSSEEEEEETTEEECCCSSTTSCCCHHHHHHHHHHHHTTCCEECCCCBHHHHTTCSEEEEEETTTEEEEEEEETTEESTTSSCCHHHHHHHHHHHTTSCCCC
11a27AARTVVLITGCSSGIGLHLAVRLASDPSQSFKVYATLRDLKTQGRLWEAARALACPPGSLETLQLDVRDSKSVAAARERVTEGRVDVLVCNAGLGLLGPLEALGEDAVASVLDVNVVGTVRMLQAFLPDMKRRGSGRVLVTGSVGGLMGLPFNDVYCASKFALEGLCESLAVLLLPFGVHLSLIECGPVHTAFMEKVLGSPEEVLDRTDIHTFHRFYQYLAHSKQVFREAAQNPEEVAEVFLTALRAPKPTLRYFTTERFLPLLRMRLDDPSGSNYVTAMHREVFGCCEEEEECCCCCHHHHHHHHHHHCCCCCCEEEEEEECCHHHCHHHHHHHHHCCCCCCCEEEEECCCCCHHHHHHHHHCCCCCCCCEEEECCCCCCCCCHHHCCHHHHHHHHHHHCHHHHHHHHHHHHHHHHHCCEEEEEEEEHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCEEEEEEEECCECCCCCCCCCCCHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCECHHHHHHHHHHHHHCCCCCCEEECCCCCHHHHHCCCCCCCCHHHHHHHHHHHHCCCEEEEESCCSSHHHHHHHHHHHTCTTCCEEEEEEESSGGGTHHHHHHHHHTTCCTTSEEEEECCTTCHHHHHHHHHTCTTSCCSEEEECCCCCCCSCGGGCCHHHHHHHHHHHTHHHHHHHHHHHHHHHHHTCEEEEEEEEGGGTSCCTTCHHHHHHHHHHHHHHHHHHHHHGGGTEEEEEEEECCBSSSTTTTSCCCHHHHHHHSCHHHHHHHHHHHHHHHHHHHHHCBCHHHHHHHHHHHHHCSSCCSEEESCSTTHHHHHTTTSSTTSHHHHHHHHHHHHC
21a34ATGDNSNVVTMIRAGSYPKVNPTPTWVRAIPFEVSVQSGIAFKVPVGSLFSANFRTDSFTSVTVMSVRAWTQLTPPVNEYSFVRLKPLFKTGDSTEEFEGRASNINTRASVGYRIPTNLRQNTVAADNVCEVRSNCRQVALVISCCFNCCCCCCCCCCCCCCCCCCCCCCCCEEEEEEEEEECCCCCCEEEEHHHHCCHHHCCCCCCCEEEEEEEEEECCCCCCCCCCEEEEEECCCCCCCCCCEEEECCCCCCCCEEEEECCHHHCCCECCCCEEEEEEECCCEEEEEEEEEECCCCSCCSCCCCCCCSCCCCCSSCCEEEEEEEEEECCTTCCEEEEGGGGCCGGGTCTTCSCEEEEEEEEEECSCCSTTCCCEEEEEECCTTCCCCCCEEEECSSTTSCCEEEEECCGGGCCCBCTTSEEEEEEESSSEEEEEEEEEEC
31a3aALFKLGAENIFLGRKAATKEEAIRFAGEQLVKGGYVEPEYVQAMLDREKLTPTYLGESIAVPHGTVEAKDRVLKTGVVFCQYPEGVRFGEEEDDIARLVIGIAARNNEHIQVITSLTNALDDESVIERLAHTTSVDEVLELLAGRKCCCCCHHHEECCCCCCCHHHHHHHHHHHHHHCCCECCHHHHHHHHHHHHCCCEEECCEECCECCHHHHHHECCCEEEEEEEEEEEECCCCCCCEEEEEEEEECCCCCHHHHHHHHHHHCCCHHHHHHHHHCCCHHHHHHHCCCCCCCCCCGGGEECSCCCSSHHHHHHHHHHHHHHTTSBCTHHHHHHHHHHHHSCCEEETTEECCBCCGGGGGGBSSCEEEEEEEEEEEECSSSTTCEEEEEEEEECSTTTHHHHHHHHHHHTCSHHHHHHHHHCCCHHHHHHHTTTCC
41a3cAQKAVILDEQAIRRALTRIAHEMIERNKCILVGIKTRGIYLAKRLAERIEQIEGNPVTVGEIDITLYRNDEPLVKGADIPVDITDQKVILVDDVLYTGRTVRAGMDALVDVGRPSSIQLAVLVDRGHRELPIRADYIGKNIPTSKSEKVMVQLDEVDQNDLVAIYENCEEEEECHHHHHHHHHHHHHHHHHHCCCEEEEECHHHHHHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCEEEEEECCCCCCCCEEEEEEEEECCCHHHHHHHHHHHHHCCCCEEEEEEEEECCCCCCCCCCCEEEEECCCCCCCEEEEECHHHHCCCEEEEECCCEEEEECHHHHHHHHHHHHHHHHHHCCCEEEEESHHHHHHHHHHHHHHHHHHSSCCEEEEEEEECCCCCCCEEEEEECSSCCTTSEEEEEEEEESSSHHHHHHHHHHHHHCCCSEEEEEEEEECCCCSSSCCCSEEEEECCCCSSCEEEEECHHHHSSCEEEEECC
51a3zATWKEATLPQVKAMLEKDDGKVSGDTVTYSGKTVHVVAAAVLPGFPFPSFEVHDKKNPTLEIPAGATVDVTFINTNKGFGHSFDITKKGPPYAVMPVIDPIVAGTGFSPVPKDGKFGYTDFTWHPTAGTYYYVCQIPGHAATGMFGKIVVKCCEEECHHHHHHHHCCCCCEEECCEEECCCCEEEEEEEECCCCCCCCCEEECCEECCEEEECCCCEEEEEEEECCCCCCCCCEEECCCCCCCCCCCCCCCCEECCCCCCCECCEEEEEEEEECCCCEEEEEECCCCCCHHHCCEEEEEECCCEEECHHHHHHHHTTCCCEEETTEEECCSSEEEEEEEESCTTSCSSCEEETTEESCEEEECTTCEEEEEEEECCTTCCCCCEEESCCSCCCSSCCCCSCSEECCCCCCCBTTBEEEEEEEECCCSEEEEEECCSTTTGGGTCEEEEEEC
61a40AEASLTGAGATFPAPVYAKWADTYQKETGNKVNYQGIGSSGGVKQIIANTVDFGASDAPLSDEKLAQEGLFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLGDIYLGKIKKWDDEAIAKLNPGLKLPSQNIAVVRRADGSGTSFVFTSYLAKVNEEWKNNVGTGSTVKWPIGLGGKGNDGIAAFVQRLPGAIGYVEYWYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWSKTFAQDLTNQKGEDAWPITSTTFILIHKDQKKPEQGTEVLKFFDWAYKTGAKQANDLDYASLPDSV…CCEEEEEECCCCHHHHHHHHHHHHHHHCCEEEEEECCHHHHHHHHHCCCCCEEEECCCCCHHHHHHHCEEEEEEEEEEEEEEECCCCCCCCCCEECHHHHHHHHHCCCCECCCHHHHHHCCCCCCCCCECEEEEECCCCHHHHHHHHHHHHHCHHHHHHCCCCCCCCCCCCEEECHHHHHHHHHHHCCCEEEEEEHHHHHCCCCEECEEECCCCCEECCCHHHHHHHCCCCCCCCCCCCCCECCCCCCCCCEEEEEEEEEECEECCHHHHHHHHHHHHHHHHHCHHHHHHCCCEECCHHH…CCEEEEEECSTTHHHHHHHHHHHHHHHCCEEEEEECCHHHHHHHHHTTSSSEEEESSCCCHHHHHHHTEEEEEEEEEEEEEEECCTTCCTTTCEECHHHHHHHHHTCCCBTTCHHHHHHSTTCCCCCCBCEEEEESSCCHHHHHHHHHHHHHCHHHHHHTCCSSSCCCSSCEEESHHHHHHHHHHHSTTEEEEEEHHHHHTTTCEECEEECTTSCEECCCHHHHHHHTTTCCTTTCSCCCCBSCCSTTCCSBEEEEEEEEESEESSHHHHHHHHHHHHHHHHHCHHHHHHTTCEECCHHH…
71a48ASITKTELDGILPLVARGKVRDIYEVDAGTLLFVATDRISAYDVIMENSIPEKGILLTKLSEFWFKFLSNDVRNHLVDIAPGKTIFDYLPAKLSEPKYKTQLEDRSLLVHKHKLIPLEVIVRGYITGSAWKEYVKTGTVHGLKQPQGLKESQEFPEPIFTPSTDENISPAQAAELVGEDLSRRVAELAVKLYSKCKDYAKEKGIIIADTKFEFGIDEKTNEIILVDEVLTPDSSRFWNGASYKVGESQDSYDKQFLRDWLTANKLNGVNGVKMPQDIVDRTRAKYIEAYETLTGSKWSHCCCCCCCCCCCCEEEECCCEEEEEEECCEEEEEECCCCEECCEECCCCCCCHHHHHHHHHHHHHHHCCCCCEECECCCCCCCCHHHHCCHHHHCHHHHHHHCCCEEEEECCEECCCEEEEEEECCHHHHHHHHHHCEECCEECCCCCCCCCEEEEEEECCECCCECCHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEEECEEEECCCCEEEECCCCCCCCCEEEEECCCCCCCCCCCCCCCHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCCSSCCCTTSSCEEEECSSEEEEEEETTEEEEEECSCCEETTEECSSCCTTHHHHHHHHHHHHHHHTTTTCEECBCCCCTTCCGGGGSCGGGGSHHHHHHHTTSEEEEECCEECCSBEEEEEECCHHHHHHHHHHSEETTEECCSCCCTTCEEEEEEECCBCCCBCCHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHTTEEEEEEEECEEEETTTTEEEECSCCSCTTTEEEEESTTCCTTSCCCCTTTHHHHHHHHHTTCTTCSSCCCCHHHHHHHHHHHHHHHHHHHCCCCCC
81a62AXNLTELKNTPVSELITLGENXGLENLARXRKQDIIFAILKQHAKSGEDIFGDGVLEILQDGFGFLRSADSSYLAGPDDIYVSPSQIRRFNLRTGDTISGKIRPPKEGERYFALLKVNEVNFDKPECEHHHHHCCCHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHCCCCEEEEEEEEECCCCCEEEECHHHCCCCCCCCEEECHHHHHHCCCCCCCEEEEEEECCCCCCCCEEEEEEEEECCECCCCBHHHHHTSCHHHHHHHHHTTTCCCCTTSCHHHHHHHHHHHHHHTTCCEEEEEEEEECTTSCEEEECGGGTTCCCTTCEEECHHHHHHTTCCTTCEEEEEEECCCTTCCSEEEEEEEEETTBCCC
91a73AALTNAQILAVIDSWEETVGQFPVITHHVPLGGGLQGTLHCYEIPLAAPYGVGFAKNGPTRWQYKRTINQVVHRWGSHTVPFLLEPDNINGKTCTASHLCHNTRCHNPLHLCWESLDDNKGRNWCPGPNGGCVHAVVCLRQGPLYGPGATVAGPQQRGSHFVVCCCHHHHHHHHHHHHHHHCCCCEEEEEEEEECCEEEEEEEEECCCCCCCCCCEEEEECCEEEEEEEECCEEEEEECCCHHHCCCCCEECCEEEEEEECCCCCCECCHHHEEEEEHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCECCCCCCCCCCCCCCHHHHHHHHHHHHHHHTTSCEEEEEEEEETTEEEEEEEEBCCSSSCCSTTEEEEETTEEEEEEEETTEEEEEETTTGGGTTSCSEETTEEEEEEETTCCTTBCCGGGEEEEEHHHHHHGGGCCCTTTTCCCSSCCSSCCTTCSSCCCSBCSCCSSSSCCC

CREATE TABLE pdb_31_12_2012 (
  "unnamed_0" BIGINT,
  "pdb_id" VARCHAR,
  "seq" VARCHAR,
  "sst3" VARCHAR,
  "sst8" VARCHAR
);

Share link

Anyone who has the link will be able to view this.