SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_037568880.1 NCBI__GCF_000744815.1:WP_037568880.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

O87590 HTH-type transcriptional regulator CelR from Thermobifida fusca (Thermomonospora fusca) (see paper)
31% identity, 98% coverage: 3:329/334 of query aligns to 8:339/340 of O87590

query
sites
O87590
T
 
T
L
 
L
A
 
E
E
 
M
V
 
V
A
 
A
A
 
A
R
 
L
A
 
A
G
 
G
V
 
V
S
 
G
A
 
R
S
 
G
T
 
T
V
 
V
S
 
S
Y
 
R
V
 
V
I
 
I
S
 
N
G
 
G
K
 
S
R
 
D
S
 
Q
I
 
V
S
 
S
Q
 
P
A
 
A
T
 
T
Q
 
R
D
 
E
R
 
A
V
 
V
L
 
K
R
 
R
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
G
Y
 
Y
H
 
V
P
 
P
N
 
N
A
 
R
S
x
A
A
 
A
R
 
R
A
 
T
L
 
L
A
 
V
S
 
T
S
 
R
R
 
R
S
 
T
N
 
D
V
 
T
I
 
V
A
 
A
L
 
L
M
 
V
V
 
V
P
 
S
L
 
E
R
 
N
S
 
N
D
 
Q
M
 
K
Y
 
L
V
 
F
-
 
A
-
 
E
P
 
P
V
 
F
I
 
Y
M
 
A
E
 
G
I
 
I
V
 
V
M
 
L
A
 
G
I
 
V
A
 
G
A
 
V
T
 
A
A
 
L
R
 
S
A
 
E
H
 
R
G
 
G
Q
 
F
D
 
Q
I
 
F
L
 
V
L
 
L
L
 
A
T
 
T
G
 
G
G
 
R
E
 
S
G
 
G
P
 
I
D
 
E
G
 
H
V
 
E
R
 
R
-
 
L
-
 
G
-
 
G
R
 
Y
V
 
L
A
 
A
G
 
G
T
 
Q
G
 
H
L
 
V
A
 
-
D
 
D
A
 
G
I
 
V
I
 
L
L
 
L
M
 
L
D
 
S
V
 
L
E
 
H
L
 
R
D
 
D
D
 
D
K
 
P
R
 
L
I
 
P
P
 
Q
V
 
M
L
 
L
R
 
D
E
 
E
A
 
A
S
 
G
M
 
V
P
 
P
A
 
Y
V
 
V
L
 
Y
I
 
G
G
 
G
L
 
R
P
 
P
S
 
L
D
 
G
T
 
V
A
 
P
D
 
E
-
 
E
-
 
Q
L
 
V
T
 
S
C
 
Y
I
 
V
D
 
D
L
 
I
D
 
D
F
 
N
E
 
I
A
 
G
T
 
G
G
 
G
A
 
R
A
 
Q
C
 
A
A
 
T
D
 
Q
H
 
R
L
 
L
A
 
I
D
 
E
L
 
T
G
 
G
H
 
H
R
 
R
D
 
R
I
 
I
A
 
A
L
 
T
I
 
I
G
 
A
E
 
G
S
 
P
R
 
Q
S
 
D
V
 
M
Y
 
V
Q
 
A
R
 
-
R
 
-
T
 
-
G
 
-
F
 
-
A
 
G
A
 
V
R
 
E
T
 
R
L
 
L
E
 
Q
G
 
G
F
 
Y
R
 
R
Q
 
E
R
 
A
A
 
L
R
 
L
A
 
A
R
 
A
G
 
G
V
 
M
-
 
E
-
 
Y
-
 
D
R
 
E
A
 
T
V
 
L
H
 
V
R
 
S
P
 
Y
C
 
G
E
 
D
G
 
F
T
 
T
F
 
Y
E
 
D
S
 
S
T
 
G
A
 
V
G
 
A
V
 
A
L
 
M
T
 
R
R
 
E
I
 
L
L
 
L
E
 
D
E
 
R
R
 
A
P
 
P
E
 
D
T
 
V
S
 
D
G
 
A
F
 
V
V
 
F
V
 
A
Q
 
A
N
 
S
E
 
D
A
 
L
A
 
M
I
 
G
R
 
L
P
 
A
L
 
A
L
 
L
T
 
R
L
 
V
L
 
L
R
 
R
Q
 
A
F
 
S
G
 
G
R
 
R
V
 
R
V
 
V
P
 
P
E
 
E
D
 
D
A
 
V
S
 
A
V
 
V
V
 
V
A
 
G
I
 
Y
C
 
D
P
 
D
E
 
S
S
 
T
V
 
V
A
 
A
L
 
E
Q
 
H
S
 
A
S
 
E
P
 
P
Q
 
P
L
 
M
T
 
T
S
 
S
V
 
V
S
 
N
I
 
Q
P
 
P
A
 
T
E
 
E
R
 
L
M
 
M
G
 
G
R
 
R
G
 
E
A
 
M
L
 
A
E
 
R
L
 
L
V
 
L
M
 
V
A
 
D
H
 
R
L
 
I
S
 
T
G
 
G
R
 
E
P
 
T
T
 
T
A
 
E
G
 
P
T
 
V
T
 
R
L
 
L
I
 
V
-
 
L
A
 
E
P
 
T
E
 
H
L
 
L
A
 
M
V
 
V
R
 
R
E
 
E
S
 
S

5yszA Transcriptional regulator celr-cellobiose complex (see paper)
30% identity, 98% coverage: 3:329/334 of query aligns to 3:326/327 of 5yszA

query
sites
5yszA
T
 
T
L
 
L
A
 
E
E
 
M
V
 
V
A
 
A
A
 
A
R
 
L
A
 
A
G
 
G
V
 
V
S
 
G
A
 
R
S
 
G
T
 
T
V
 
V
S
 
S
Y
 
R
V
 
V
I
 
I
S
 
N
G
 
G
K
 
S
R
 
D
S
 
Q
I
 
V
S
 
S
Q
 
P
A
 
A
T
 
T
Q
 
R
D
 
E
R
 
A
V
 
V
L
 
K
R
 
R
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
G
Y
 
Y
H
 
V
P
 
P
N
 
N
A
 
-
S
 
-
A
 
-
R
 
-
A
 
-
L
 
-
A
 
-
S
 
-
S
 
R
R
 
R
S
 
T
N
 
D
V
 
T
I
 
V
A
 
A
L
 
L
M
 
V
V
 
V
P
 
S
L
 
E
R
 
N
S
 
N
D
 
Q
M
 
K
Y
 
L
V
 
F
-
 
A
-
x
E
P
 
P
V
x
F
I
x
Y
M
 
A
E
 
G
I
 
I
V
 
V
M
 
L
A
 
G
I
 
V
A
 
G
A
 
V
T
 
A
A
 
L
R
 
S
A
 
E
H
 
R
G
 
G
Q
 
F
D
 
Q
I
 
F
L
 
V
L
 
L
L
 
A
T
 
T
G
 
G
G
 
R
E
 
S
G
 
G
P
 
I
D
 
E
G
 
H
V
 
E
R
 
R
-
 
L
-
 
G
-
 
G
R
 
Y
V
 
L
A
 
A
G
 
G
T
 
Q
G
 
H
L
 
V
A
 
-
D
 
D
A
 
G
I
 
V
I
 
L
L
 
L
M
 
L
D
x
S
V
 
L
E
 
H
L
 
R
D
 
D
D
 
D
K
 
P
R
 
L
I
 
P
P
 
Q
V
 
M
L
 
L
R
 
D
E
 
E
A
 
A
S
 
G
M
 
V
P
 
P
A
 
Y
V
 
V
L
 
Y
I
x
G
G
 
G
L
 
R
P
 
P
S
 
L
D
 
G
T
 
V
A
 
P
D
 
E
-
 
E
-
 
Q
L
 
V
T
 
S
C
 
Y
I
 
V
D
|
D
L
x
I
D
 
D
F
x
N
E
 
I
A
 
G
T
 
G
G
 
G
A
 
R
A
 
Q
C
 
A
A
 
T
D
 
Q
H
 
R
L
 
L
A
 
I
D
 
E
L
 
T
G
 
G
H
 
H
R
 
R
D
 
R
I
 
I
A
 
A
L
 
T
I
 
I
G
 
A
E
 
G
S
 
P
R
 
Q
S
 
D
V
 
M
Y
 
V
Q
 
A
R
 
-
R
 
-
T
 
-
G
 
-
F
 
-
A
 
G
A
 
V
R
 
E
T
x
R
L
 
L
E
 
Q
G
 
G
F
 
Y
R
 
R
Q
 
E
R
 
A
A
 
L
R
 
L
A
 
A
R
 
A
G
 
G
V
 
M
R
 
E
-
 
Y
-
 
D
-
 
E
A
 
T
V
 
L
H
 
V
R
 
S
P
 
Y
C
 
G
E
 
D
G
x
F
T
 
T
F
 
Y
E
 
D
S
 
S
T
 
G
A
 
V
G
 
A
V
 
A
L
 
M
T
 
R
R
 
E
I
 
L
L
 
L
E
 
D
E
 
R
R
 
A
P
 
P
E
 
D
T
 
V
S
 
D
G
 
A
F
 
V
V
 
F
V
 
A
Q
 
A
N
 
S
E
 
D
A
 
L
A
 
M
I
 
G
R
 
L
P
 
A
L
 
A
L
 
L
T
 
R
L
 
V
L
 
L
R
 
R
Q
 
A
F
 
S
G
 
G
R
 
R
V
 
R
V
 
V
P
 
P
E
 
E
D
 
D
A
 
V
S
 
A
V
 
V
V
 
V
A
 
G
I
 
Y
C
x
D
P
 
D
E
 
S
S
 
T
V
 
V
A
 
A
L
 
E
Q
 
H
S
 
A
S
 
E
P
 
P
Q
 
P
L
 
M
T
 
T
S
 
S
V
 
V
S
 
N
I
x
Q
P
 
P
A
 
T
E
 
E
R
 
L
M
|
M
G
 
G
R
 
R
G
 
E
A
 
M
L
 
A
E
 
R
L
 
L
V
 
L
M
 
V
A
 
D
H
 
R
L
 
I
S
 
T
G
 
G
R
 
E
P
 
T
T
 
T
A
 
E
G
 
P
T
 
V
T
 
R
L
 
L
I
 
V
-
 
L
A
 
E
P
 
T
E
 
H
L
 
L
A
 
M
V
 
V
R
 
R
E
 
E
S
 
S

1rzrG Crystal structure of transcriptional regulator-phosphoprotein-DNA complex (see paper)
25% identity, 99% coverage: 2:330/334 of query aligns to 3:331/332 of 1rzrG

query
sites
1rzrG
V
 
V
T
|
T
L
x
I
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
R
R
 
E
A
 
A
G
 
S
V
 
V
S
|
S
A
x
M
S
x
A
T
|
T
V
 
V
S
|
S
Y
x
R
V
 
V
I
 
V
S
x
N
G
 
G
K
 
N
R
 
P
S
x
N
I
x
V
S
x
K
Q
 
P
A
 
S
T
 
T
Q
 
R
D
 
K
R
 
K
V
 
V
L
 
L
R
 
E
A
 
T
V
 
I
T
 
E
E
 
R
L
 
L
G
 
G
Y
|
Y
H
 
R
P
|
P
N
|
N
A
 
A
S
 
V
A
|
A
R
|
R
A
 
G
L
|
L
A
|
A
S
|
S
S
 
K
R
 
K
S
 
T
N
 
T
V
 
T
I
 
V
A
 
G
L
 
V
M
 
I
V
 
I
P
 
P
L
 
D
R
 
I
S
 
S
D
 
N
M
 
I
Y
 
F
V
 
Y
P
 
A
V
 
-
I
 
-
M
 
-
E
 
E
I
 
L
V
 
A
M
 
R
A
 
G
I
 
I
A
 
E
A
 
D
T
 
I
A
 
A
R
 
T
A
 
M
H
 
Y
G
 
K
Q
 
Y
D
 
N
I
 
I
L
 
I
L
 
L
L
 
S
T
 
N
G
 
S
G
 
D
E
 
Q
G
 
N
P
 
Q
D
 
D
G
 
K
V
 
E
R
 
L
R
 
H
V
 
L
A
 
L
G
 
N
T
 
N
G
 
M
L
 
L
A
 
G
-
 
K
-
 
Q
-
 
V
D
 
D
A
 
G
I
 
I
I
 
I
L
 
F
M
 
M
D
 
S
V
 
G
E
 
N
L
 
V
D
 
T
D
 
E
K
 
E
R
 
H
I
 
V
P
 
E
V
 
E
L
 
L
R
 
K
E
 
K
A
 
S
S
 
P
M
 
V
P
 
P
A
 
V
V
 
V
L
 
L
I
 
A
G
 
A
L
 
S
P
 
I
S
 
E
D
 
S
T
 
T
A
 
N
D
 
Q
L
 
I
T
 
P
C
 
S
I
 
V
D
 
T
L
 
I
D
 
D
F
 
Y
E
 
E
A
 
Q
T
 
A
G
 
A
A
 
F
A
 
D
C
 
A
A
 
V
D
 
Q
H
 
S
L
 
L
A
 
I
D
 
D
L
 
S
G
 
G
H
 
H
R
 
K
D
 
N
I
 
I
A
 
A
L
 
F
I
 
V
G
 
S
E
 
G
S
 
T
R
 
L
S
 
-
V
 
-
Y
 
-
Q
 
-
R
 
E
R
 
E
T
 
P
G
 
I
F
 
N
A
 
H
A
 
A
R
 
K
T
 
K
L
 
V
E
 
K
G
 
G
F
 
Y
R
 
K
Q
 
R
R
 
A
A
 
L
R
 
T
A
 
E
R
 
S
G
 
G
-
 
L
-
 
P
V
 
V
R
 
R
A
 
D
V
 
S
H
 
Y
R
 
-
P
 
I
C
 
V
E
 
E
G
 
G
T
 
D
F
 
Y
E
 
T
S
 
Y
T
 
D
A
 
S
G
 
G
V
 
I
-
 
E
-
 
A
L
 
V
T
 
E
R
 
K
I
 
L
L
 
L
E
 
E
E
 
E
R
 
D
P
 
E
E
 
K
-
 
P
T
 
T
S
 
A
G
 
I
F
 
F
V
 
V
V
 
G
Q
 
T
N
 
D
E
 
E
A
 
M
A
 
A
I
 
L
R
 
-
P
 
G
L
 
V
L
 
I
T
 
H
L
 
G
L
 
A
R
 
Q
Q
 
D
F
 
R
G
 
G
R
 
L
V
 
N
V
 
V
P
 
P
E
 
N
D
 
D
A
 
L
S
 
E
V
 
I
V
 
I
A
 
G
I
 
F
C
 
D
P
 
N
E
 
T
S
 
R
V
 
L
A
 
S
L
 
T
Q
 
M
S
 
V
S
 
R
P
 
P
Q
 
Q
L
 
L
T
 
T
S
 
S
V
 
V
S
 
V
I
 
Q
P
 
P
A
 
M
E
 
Y
R
 
D
M
 
I
G
 
G
R
 
A
G
 
V
A
 
A
L
 
M
E
 
R
L
 
L
V
 
L
M
 
T
A
 
K
H
 
Y
L
 
M
S
 
N
G
 
K
R
 
E
P
 
T
T
 
V
A
 
D
G
 
S
T
 
S
T
 
I
L
 
V
I
 
Q
A
 
L
P
 
P
E
 
H
-
 
R
L
 
I
A
 
E
V
 
F
R
 
R
E
 
Q
S
 
S
S
 
T

1rzrA Crystal structure of transcriptional regulator-phosphoprotein-DNA complex (see paper)
25% identity, 99% coverage: 2:330/334 of query aligns to 3:331/332 of 1rzrA

query
sites
1rzrA
V
 
V
T
 
T
L
x
I
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
R
R
 
E
A
 
A
G
 
S
V
|
V
S
|
S
A
x
M
S
 
A
T
|
T
V
 
V
S
|
S
Y
x
R
V
 
V
I
 
V
S
x
N
G
 
G
K
 
N
R
 
P
S
x
N
I
x
V
S
x
K
Q
 
P
A
 
S
T
|
T
Q
 
R
D
 
K
R
 
K
V
 
V
L
 
L
R
 
E
A
 
T
V
 
I
T
 
E
E
 
R
L
 
L
G
 
G
Y
|
Y
H
 
R
P
|
P
N
|
N
A
 
A
S
 
V
A
|
A
R
|
R
A
 
G
L
|
L
A
|
A
S
 
S
S
 
K
R
 
K
S
 
T
N
 
T
V
 
T
I
 
V
A
 
G
L
 
V
M
 
I
V
 
I
P
 
P
L
 
D
R
 
I
S
 
S
D
 
N
M
 
I
Y
 
F
V
 
Y
P
 
A
V
 
-
I
 
-
M
 
-
E
 
E
I
 
L
V
 
A
M
 
R
A
 
G
I
 
I
A
 
E
A
 
D
T
 
I
A
 
A
R
 
T
A
 
M
H
 
Y
G
 
K
Q
 
Y
D
 
N
I
 
I
L
 
I
L
 
L
L
 
S
T
 
N
G
 
S
G
 
D
E
 
Q
G
x
N
P
 
Q
D
|
D
G
 
K
V
 
E
R
 
L
R
 
H
V
 
L
A
 
L
G
 
N
T
 
N
G
 
M
L
 
L
A
 
G
-
 
K
-
 
Q
-
 
V
D
 
D
A
 
G
I
 
I
I
 
I
L
 
F
M
 
M
D
 
S
V
 
G
E
 
N
L
 
V
D
 
T
D
 
E
K
 
E
R
 
H
I
 
V
P
 
E
V
 
E
L
 
L
R
 
K
E
 
K
A
 
S
S
 
P
M
 
V
P
 
P
A
 
V
V
 
V
L
 
L
I
 
A
G
 
A
L
 
S
P
 
I
S
 
E
D
 
S
T
 
T
A
 
N
D
 
Q
L
 
I
T
 
P
C
 
S
I
 
V
D
 
T
L
 
I
D
 
D
F
 
Y
E
 
E
A
 
Q
T
 
A
G
 
A
A
 
F
A
 
D
C
 
A
A
 
V
D
 
Q
H
 
S
L
 
L
A
 
I
D
 
D
L
 
S
G
 
G
H
 
H
R
 
K
D
 
N
I
 
I
A
 
A
L
 
F
I
 
V
G
 
S
E
 
G
S
 
T
R
 
L
S
 
-
V
 
-
Y
 
-
Q
 
-
R
 
E
R
 
E
T
 
P
G
 
I
F
 
N
A
 
H
A
 
A
R
 
K
T
 
K
L
 
V
E
 
K
G
 
G
F
 
Y
R
 
K
Q
 
R
R
 
A
A
 
L
R
 
T
A
 
E
R
 
S
G
 
G
-
 
L
-
 
P
V
 
V
R
 
R
A
 
D
V
 
S
H
 
Y
R
 
-
P
 
I
C
 
V
E
 
E
G
 
G
T
 
D
F
 
Y
E
 
T
S
 
Y
T
 
D
A
 
S
G
 
G
V
 
I
-
 
E
-
 
A
L
 
V
T
 
E
R
 
K
I
 
L
L
 
L
E
 
E
E
 
E
R
 
D
P
 
E
E
 
K
-
 
P
T
 
T
S
 
A
G
 
I
F
 
F
V
 
V
V
 
G
Q
 
T
N
 
D
E
 
E
A
 
M
A
 
A
I
 
L
R
 
-
P
 
G
L
 
V
L
 
I
T
 
H
L
 
G
L
 
A
R
 
Q
Q
 
D
F
 
R
G
 
G
R
 
L
V
 
N
V
 
V
P
 
P
E
 
N
D
 
D
A
 
L
S
 
E
V
 
I
V
 
I
A
 
G
I
 
F
C
 
D
P
 
N
E
 
T
S
 
R
V
 
L
A
 
S
L
 
T
Q
 
M
S
 
V
S
 
R
P
 
P
Q
 
Q
L
 
L
T
 
T
S
 
S
V
 
V
S
 
V
I
 
Q
P
 
P
A
 
M
E
 
Y
R
 
D
M
 
I
G
 
G
R
 
A
G
 
V
A
 
A
L
 
M
E
 
R
L
 
L
V
 
L
M
 
T
A
 
K
H
 
Y
L
 
M
S
 
N
G
 
K
R
 
E
P
 
T
T
 
V
A
 
D
G
 
S
T
 
S
T
 
I
L
 
V
I
 
Q
A
 
L
P
 
P
E
 
H
-
 
R
L
 
I
A
 
E
V
 
F
R
 
R
E
 
Q
S
 
S
S
 
T

3oqoA Ccpa-hpr-ser46p-syn cre (see paper)
25% identity, 93% coverage: 2:313/334 of query aligns to 3:313/333 of 3oqoA

query
sites
3oqoA
V
 
I
T
|
T
L
x
I
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
R
R
 
E
A
 
A
G
 
N
V
|
V
S
|
S
A
 
M
S
x
A
T
|
T
V
 
V
S
|
S
Y
x
R
V
 
V
I
 
V
S
x
N
G
 
G
K
 
N
R
 
P
S
x
N
I
x
V
S
x
K
Q
 
P
A
 
T
T
|
T
Q
 
R
D
 
K
R
 
K
V
 
V
L
 
L
R
 
E
A
 
A
V
 
I
T
 
E
E
 
R
L
 
L
G
 
G
Y
|
Y
H
 
R
P
 
P
N
|
N
A
 
A
S
 
V
A
|
A
R
|
R
A
 
G
L
|
L
A
|
A
S
 
S
S
x
K
R
 
K
S
 
T
N
 
T
V
 
T
I
 
V
A
 
G
L
 
V
M
 
I
V
 
I
P
 
P
L
 
D
R
 
I
S
 
S
D
 
S
M
 
I
Y
 
F
V
 
Y
P
 
S
V
 
-
I
 
-
M
 
-
E
 
E
I
 
L
V
 
A
M
 
R
A
 
G
I
 
I
A
 
E
A
 
D
T
 
I
A
 
A
R
 
T
A
 
M
H
 
Y
G
 
K
Q
 
Y
D
 
N
I
 
I
L
 
I
L
 
L
L
 
S
T
 
N
G
 
S
G
 
D
E
 
Q
G
 
N
P
 
M
D
 
E
G
 
K
V
 
E
R
 
L
R
 
H
V
 
L
A
 
L
G
 
N
T
 
T
G
 
M
L
 
L
A
 
G
-
 
K
-
 
Q
-
 
V
D
 
D
A
 
G
I
 
I
I
 
V
L
 
F
M
 
M
D
 
G
V
 
G
E
 
N
L
 
I
D
 
T
D
 
D
K
 
E
R
 
H
I
 
V
P
 
A
V
 
E
L
 
F
R
 
K
E
 
R
A
 
S
S
 
P
M
 
V
P
 
P
A
 
I
V
 
V
L
 
L
I
 
A
G
 
A
L
 
S
P
 
V
S
 
E
D
 
E
T
 
Q
A
 
E
D
 
E
L
 
T
T
 
P
C
 
S
I
 
V
D
 
A
L
 
I
D
 
D
F
 
Y
E
 
E
A
 
Q
T
 
A
G
 
I
A
 
Y
A
 
D
C
 
A
A
 
V
D
 
K
H
 
L
L
 
L
A
 
V
D
 
D
L
 
K
G
 
G
H
 
H
R
 
T
D
 
D
I
 
I
A
 
A
L
 
F
I
 
V
-
 
S
-
 
G
-
 
P
-
 
M
G
 
A
E
 
E
S
 
P
R
 
I
S
 
N
V
 
R
Y
 
S
Q
 
K
R
 
K
R
 
L
T
 
Q
G
 
G
F
 
Y
A
 
-
A
 
K
R
 
R
T
 
A
L
 
L
E
 
E
G
 
E
-
 
A
-
 
N
-
 
L
-
 
P
F
 
F
R
 
N
Q
 
E
R
 
Q
A
 
F
R
 
V
A
 
A
R
 
E
G
 
G
V
 
-
R
 
-
A
 
-
V
 
-
H
 
-
R
 
-
P
 
-
C
 
-
E
 
D
G
 
Y
T
 
T
F
 
Y
E
 
D
S
 
S
T
 
G
A
 
L
G
 
E
V
 
A
L
 
L
T
 
Q
R
 
H
I
 
L
-
 
M
-
 
S
L
 
L
E
 
D
E
 
K
R
 
K
P
 
P
E
 
-
T
 
T
S
 
A
G
 
I
F
 
L
V
 
S
V
 
A
Q
 
T
N
 
D
E
 
E
A
 
M
A
 
A
I
 
L
R
 
G
P
 
-
L
 
I
L
 
I
T
 
H
L
 
A
L
 
A
R
 
Q
Q
 
D
F
 
Q
G
 
G
R
 
L
V
 
S
V
 
I
P
 
P
E
 
E
D
 
D
A
 
L
S
 
D
V
 
I
V
 
I
A
 
G
I
 
F
C
 
D
P
 
N
E
 
T
S
 
R
V
 
L
A
 
S
L
 
L
Q
 
M
S
 
V
S
 
R
P
 
P
Q
 
Q
L
 
L
T
 
S
S
 
T
V
 
V
S
 
V
I
 
Q
P
 
P
A
 
T
E
 
Y
R
 
D
M
 
I
G
 
G
R
 
A
G
 
V
A
 
A
L
 
M
E
 
R
L
 
L
V
 
L
M
 
T
A
 
K
H
 
L
L
 
M
S
 
N
G
 
K
R
 
E
P
 
P

Sites not aligning to the query:

2jcgA Apo form of the catabolite control protein a (ccpa) from bacillus megaterium, with the DNA binding domain (see paper)
24% identity, 93% coverage: 2:310/334 of query aligns to 1:300/322 of 2jcgA

query
sites
2jcgA
V
 
V
T
 
T
L
 
I
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
R
R
 
E
A
 
A
G
 
S
V
 
V
S
 
S
A
 
M
S
 
A
T
 
T
V
 
V
S
 
S
Y
 
R
V
 
V
I
 
V
S
 
N
G
 
G
K
 
N
R
 
P
S
 
N
I
 
V
S
 
K
Q
 
P
A
 
S
T
 
T
Q
 
R
D
 
K
R
 
K
V
 
V
L
 
L
R
 
E
A
 
T
V
 
I
T
 
E
E
 
R
L
 
L
G
 
G
Y
 
Y
H
 
R
P
 
P
N
 
N
A
 
A
S
 
V
A
 
-
R
 
-
A
 
-
L
 
-
A
 
-
S
 
-
S
 
-
R
 
-
S
 
T
N
 
T
V
 
T
I
 
V
A
 
G
L
 
V
M
 
I
V
 
I
P
 
P
L
 
D
R
 
I
S
 
S
D
 
N
M
 
I
Y
 
F
V
 
Y
P
 
A
V
 
-
I
 
-
M
 
-
E
 
E
I
 
L
V
 
A
M
 
R
A
 
G
I
 
I
A
 
E
A
 
D
T
 
I
A
 
A
R
 
S
A
 
M
H
 
Y
G
 
K
Q
 
Y
D
 
N
I
 
I
L
 
I
L
 
L
L
 
S
T
 
N
G
 
S
G
 
D
E
 
Q
G
 
N
P
 
Q
D
 
D
G
 
K
V
 
Q
R
 
L
R
 
H
V
 
L
A
 
L
G
 
N
T
 
N
G
 
M
L
 
L
A
 
G
-
 
K
-
 
Q
-
 
V
D
 
D
A
 
G
I
 
I
I
 
I
L
 
F
M
 
M
D
 
S
V
 
G
E
 
N
L
 
V
D
 
T
D
 
E
K
 
E
R
 
H
I
 
V
P
 
E
V
 
E
L
 
L
R
 
K
E
 
K
A
 
S
S
 
P
M
 
V
P
 
P
A
 
V
V
 
V
L
 
L
I
 
A
G
 
A
L
 
S
P
 
I
S
 
E
D
 
S
T
 
T
A
 
N
D
 
Q
L
 
I
T
 
P
C
 
S
I
 
V
D
 
T
L
 
I
D
 
D
F
 
Y
E
 
E
A
 
Q
T
 
A
G
 
A
A
 
F
A
 
D
C
 
A
A
 
V
D
 
Q
H
 
S
L
 
L
A
 
I
D
 
D
L
 
S
G
 
G
H
 
H
R
 
K
D
 
N
I
 
I
A
 
A
L
 
F
I
 
V
G
 
S
E
 
G
S
 
T
R
 
L
S
 
-
V
 
-
Y
 
-
Q
 
-
R
 
E
R
 
E
T
 
P
G
 
I
F
 
N
A
 
H
A
 
A
R
 
K
T
 
K
L
 
V
E
 
K
G
 
G
F
 
Y
R
 
K
Q
 
R
R
 
A
A
 
L
R
 
T
A
 
E
R
 
S
G
 
G
-
 
L
-
 
P
V
 
V
R
 
R
A
 
D
V
 
S
H
 
Y
R
 
-
P
 
I
C
 
V
E
 
E
G
 
G
T
 
D
F
 
Y
E
 
T
S
 
Y
T
 
D
A
 
S
G
 
G
V
 
I
-
 
E
-
 
A
L
 
V
T
x
E
R
 
K
I
 
L
L
 
L
E
|
E
E
 
E
R
 
D
P
 
E
E
 
K
-
 
P
T
 
T
S
 
A
G
 
I
F
 
F
V
 
V
V
 
G
Q
 
T
N
 
D
E
 
E
A
 
M
A
 
A
I
 
L
R
 
G
P
 
-
L
 
V
L
 
I
T
 
H
L
 
G
L
 
A
R
 
Q
Q
 
D
F
 
R
G
 
G
R
 
L
V
 
N
V
 
V
P
 
P
E
 
N
D
 
D
A
 
L
S
 
E
V
 
I
V
 
I
A
 
G
I
 
F
C
 
D
P
 
N
E
 
T
S
 
R
V
 
L
A
 
S
L
 
T
Q
 
M
S
 
V
S
 
R
P
 
P
Q
 
Q
L
 
L
T
 
T
S
 
S
V
 
V
S
 
V
I
 
Q
P
 
P
A
 
M
E
 
Y
R
 
D
M
 
I
G
 
G
R
 
A
G
 
V
A
 
A
L
 
M
E
 
R
L
 
L
V
 
L
M
 
T
A
 
K
H
 
Y
L
 
M
S
 
N

P0ACP7 HTH-type transcriptional repressor PurR; Pur regulon repressor; Purine nucleotide synthesis repressor from Escherichia coli (strain K12) (see 5 papers)
25% identity, 99% coverage: 1:329/334 of query aligns to 1:330/341 of P0ACP7

query
sites
P0ACP7
M
|
M
V
 
A
T
 
T
L
 
I
A
 
K
E
 
D
V
 
V
A
 
A
A
 
K
R
 
R
A
 
A
G
 
N
V
 
V
S
 
S
A
 
T
S
 
T
T
 
T
V
 
V
S
 
S
Y
 
H
V
 
V
I
 
I
S
 
N
G
 
K
K
 
T
R
 
R
S
 
F
I
 
V
S
 
A
Q
 
E
A
 
E
T
 
T
Q
 
R
D
 
N
R
 
A
V
 
V
L
 
W
R
 
A
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
H
Y
 
Y
H
 
S
P
 
P
N
 
S
A
 
A
S
 
V
A
 
A
R
 
R
A
 
S
L
 
L
A
x
K
S
 
V
S
 
N
R
 
H
S
 
T
N
 
K
V
 
S
I
 
I
A
 
G
L
 
L
M
 
L
V
 
A
P
 
T
L
 
S
R
 
S
S
 
E
D
 
A
M
 
A
Y
|
Y
V
 
-
P
 
-
V
 
-
I
 
F
M
 
A
E
 
E
I
 
I
V
 
I
M
 
E
A
 
A
I
 
V
A
 
E
A
 
K
T
 
N
A
 
C
R
 
F
A
 
Q
H
 
K
G
 
G
Q
 
Y
D
 
T
I
 
L
L
 
I
L
 
L
L
 
G
T
 
N
G
 
A
G
 
W
E
 
N
G
 
N
P
 
L
D
 
E
G
 
K
V
 
Q
R
 
R
-
 
A
-
 
Y
-
 
L
R
 
S
V
 
M
A
 
M
G
 
A
T
 
Q
G
 
K
L
 
R
A
 
V
D
 
D
A
 
G
I
 
L
I
 
L
L
 
V
M
 
M
D
 
C
V
 
S
E
 
E
L
 
Y
D
 
P
D
 
E
K
 
P
R
 
L
I
 
L
P
 
A
V
 
M
L
 
L
R
 
E
E
 
E
A
 
Y
-
 
R
S
 
H
M
 
I
P
 
P
A
 
M
V
 
V
L
 
V
I
 
M
G
 
D
L
x
W
P
 
G
S
 
E
D
 
A
T
 
K
A
 
A
D
 
D
L
 
F
T
 
T
-
 
D
-
 
A
C
 
V
I
 
I
D
 
D
L
 
N
D
 
A
F
 
F
E
 
E
A
 
G
T
 
-
G
 
G
A
 
Y
A
 
M
C
 
A
A
 
G
D
 
R
H
 
Y
L
 
L
A
 
I
D
 
E
L
 
R
G
 
G
H
 
H
R
 
R
D
 
E
I
 
I
A
 
G
L
 
V
I
 
I
G
 
P
E
 
-
S
 
-
R
 
-
S
 
G
V
 
P
Y
 
L
Q
 
E
R
|
R
R
 
N
T
|
T
G
 
G
F
 
-
A
 
-
A
 
A
R
 
G
T
 
R
L
 
L
E
 
A
G
 
G
F
 
F
R
 
M
Q
 
K
R
 
A
A
 
M
R
 
E
A
 
E
R
 
A
G
 
M
V
 
I
R
 
K
A
 
V
V
 
P
H
 
E
R
 
S
P
 
W
-
 
I
C
 
V
E
 
Q
G
 
G
T
 
D
F
|
F
E
 
E
S
 
P
T
 
E
A
 
S
G
 
G
V
 
Y
-
 
R
-
 
A
L
 
M
T
 
Q
R
 
Q
I
 
I
L
 
L
E
 
S
E
 
Q
R
 
P
P
 
H
E
 
R
T
 
P
S
 
T
G
 
A
F
 
V
V
 
F
V
 
C
Q
 
G
N
 
G
E
 
D
A
 
I
A
 
M
I
 
A
R
 
M
P
 
G
L
 
A
L
 
L
T
 
C
L
 
A
L
 
A
R
 
D
Q
 
E
F
 
M
G
 
G
R
 
L
V
 
R
V
 
V
P
 
P
E
 
Q
D
 
D
A
 
V
S
 
S
V
 
L
V
 
I
A
 
G
I
 
Y
C
x
D
P
 
N
E
 
V
S
 
R
V
 
N
A
 
A
L
 
R
Q
 
Y
S
 
F
S
 
T
P
 
P
Q
 
A
L
 
L
T
 
T
S
 
T
V
 
I
S
 
H
I
 
Q
P
 
P
A
 
K
E
 
D
R
 
S
M
 
L
G
 
G
R
 
E
G
 
T
A
 
A
L
 
F
E
 
N
L
 
M
V
 
L
M
 
L
A
 
D
H
 
R
L
 
I
-
 
V
S
 
N
G
 
K
R
 
R
P
 
E
T
 
E
A
 
P
G
 
Q
T
 
S
T
 
I
L
 
E
I
 
V
A
 
H
P
 
P
E
 
R
L
 
L
A
 
I
V
 
E
R
 
R
E
 
R
S
 
S

1wetA Structure of the purr-guanine-purf operator complex (see paper)
25% identity, 98% coverage: 3:329/334 of query aligns to 1:328/338 of 1wetA

query
sites
1wetA
T
 
T
L
 
I
A
 
K
E
 
D
V
 
V
A
 
A
A
 
K
R
 
R
A
 
A
G
 
N
V
 
V
S
|
S
A
 
T
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
H
V
 
V
I
 
I
S
 
N
G
 
K
K
 
T
R
|
R
S
 
F
I
x
V
S
x
A
Q
 
E
A
 
E
T
|
T
Q
 
R
D
 
N
R
 
A
V
 
V
L
 
W
R
 
A
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
H
Y
 
Y
H
 
S
P
 
P
N
 
S
A
 
A
S
 
V
A
 
A
R
 
R
A
 
S
L
|
L
A
x
K
S
 
V
S
 
N
R
 
H
S
 
T
N
 
K
V
 
S
I
 
I
A
 
G
L
 
L
M
 
L
V
 
A
P
 
T
L
 
S
R
 
S
S
 
E
D
 
A
M
 
A
Y
|
Y
V
 
-
P
 
-
V
 
-
I
x
F
M
 
A
E
 
E
I
 
I
V
 
I
M
 
E
A
 
A
I
 
V
A
 
E
A
 
K
T
 
N
A
 
C
R
 
F
A
 
Q
H
 
K
G
 
G
Q
 
Y
D
 
T
I
 
L
L
 
I
L
 
L
L
 
G
T
 
N
G
 
A
G
 
W
E
 
N
G
 
N
P
 
L
D
 
E
G
 
K
V
 
Q
R
 
R
-
 
A
-
 
Y
-
 
L
R
 
S
V
 
M
A
 
M
G
 
A
T
 
Q
G
 
K
L
 
R
A
 
V
D
 
D
A
 
G
I
 
L
I
 
L
L
 
V
M
 
M
D
 
C
V
 
S
E
 
E
L
 
Y
D
 
P
D
 
E
K
 
P
R
 
L
I
 
L
P
 
A
V
 
M
L
 
L
R
 
E
E
 
E
A
 
Y
-
 
R
S
 
H
M
 
I
P
 
P
A
 
M
V
 
V
L
 
V
I
 
M
G
 
D
L
 
W
P
 
G
S
 
E
D
 
A
T
 
K
A
 
A
D
 
D
L
 
F
T
 
T
-
 
D
-
 
A
C
 
V
I
 
I
D
 
D
L
 
N
D
 
A
F
 
F
E
 
E
A
 
G
T
 
-
G
 
G
A
 
Y
A
 
M
C
 
A
A
 
G
D
 
R
H
 
Y
L
 
L
A
 
I
D
 
E
L
 
R
G
 
G
H
 
H
R
 
R
D
 
E
I
 
I
A
 
G
L
 
V
I
 
I
G
 
P
E
 
-
S
 
-
R
 
-
S
 
G
V
 
P
Y
 
L
Q
 
E
R
|
R
R
 
N
T
|
T
G
 
G
F
 
-
A
 
-
A
 
A
R
 
G
T
x
R
L
 
L
E
 
A
G
 
G
F
 
F
R
 
M
Q
 
K
R
 
A
A
 
M
R
 
E
A
 
E
R
 
A
G
 
M
V
 
I
R
 
K
A
 
V
V
 
P
H
 
E
R
 
S
P
 
W
-
 
I
C
 
V
E
 
Q
G
 
G
T
 
D
F
|
F
E
 
E
S
 
P
T
 
E
A
 
S
G
 
G
V
 
Y
-
 
R
-
 
A
L
 
M
T
 
Q
R
 
Q
I
 
I
L
 
L
E
 
S
E
 
Q
R
 
P
P
 
H
E
 
R
T
 
P
S
 
T
G
 
A
F
 
V
V
 
F
V
 
C
Q
 
G
N
 
G
E
 
D
A
 
I
A
 
M
I
 
A
R
 
M
P
 
G
L
 
A
L
 
L
T
 
C
L
 
A
L
 
A
R
 
D
Q
 
E
F
 
M
G
 
G
R
 
L
V
 
R
V
 
V
P
 
P
E
 
Q
D
 
D
A
 
V
S
 
S
V
 
L
V
 
I
A
 
G
I
 
Y
C
x
D
P
 
N
E
 
V
S
 
R
V
 
N
A
 
A
L
 
R
Q
 
Y
S
 
F
S
 
T
P
 
P
Q
 
A
L
 
L
T
 
T
S
 
T
V
 
I
S
 
H
I
 
Q
P
 
P
A
 
K
E
 
D
R
 
S
M
 
L
G
 
G
R
 
E
G
 
T
A
 
A
L
 
F
E
 
N
L
 
M
V
 
L
M
 
L
A
 
D
H
 
R
L
 
I
-
 
V
S
 
N
G
 
K
R
 
R
P
 
E
T
 
E
A
 
P
G
 
Q
T
 
S
T
 
I
L
 
E
I
 
V
A
 
H
P
 
P
E
 
R
L
 
L
A
 
I
V
 
E
R
 
R
E
 
R
S
 
S

1jftA Purine repressor mutant-hypoxanthine-purf operator complex (see paper)
25% identity, 98% coverage: 3:329/334 of query aligns to 2:329/340 of 1jftA

query
sites
1jftA
T
 
T
L
 
I
A
 
K
E
 
D
V
 
V
A
 
A
A
 
K
R
 
R
A
 
A
G
 
N
V
 
V
S
|
S
A
 
T
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
H
V
 
V
I
 
I
S
 
N
G
 
K
K
 
T
R
|
R
S
 
F
I
x
V
S
x
A
Q
 
E
A
 
E
T
|
T
Q
 
R
D
 
N
R
 
A
V
 
V
L
 
W
R
 
A
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
H
Y
 
Y
H
 
S
P
 
P
N
 
S
A
 
A
S
 
V
A
 
A
R
 
R
A
 
S
L
|
L
A
x
K
S
 
V
S
 
N
R
 
H
S
 
T
N
 
K
V
 
S
I
 
I
A
 
G
L
 
L
M
 
L
V
 
A
P
 
T
L
 
S
R
 
S
S
 
E
D
 
A
M
 
A
Y
|
Y
V
 
-
P
 
-
V
 
-
I
x
F
M
 
A
E
 
E
I
 
I
V
 
I
M
 
E
A
 
A
I
 
V
A
 
E
A
 
K
T
 
N
A
 
C
R
 
F
A
 
Q
H
 
K
G
 
G
Q
 
Y
D
 
T
I
 
L
L
 
I
L
 
L
L
 
G
T
 
N
G
 
A
G
 
W
E
 
N
G
 
N
P
 
L
D
 
E
G
 
K
V
 
Q
R
 
R
-
 
A
-
 
Y
-
 
L
R
 
S
V
 
M
A
 
M
G
 
A
T
 
Q
G
 
K
L
 
R
A
 
V
D
 
D
A
 
G
I
 
L
I
 
L
L
 
V
M
 
M
D
 
C
V
 
S
E
 
E
L
 
Y
D
 
P
D
 
E
K
 
P
R
 
L
I
 
L
P
 
A
V
 
M
L
 
L
R
 
E
E
 
E
A
 
Y
-
 
R
S
 
H
M
 
I
P
 
P
A
 
M
V
 
V
L
 
V
I
 
M
G
 
D
L
 
A
P
 
G
S
 
E
D
 
A
T
 
K
A
 
A
D
 
D
L
 
F
T
 
T
-
 
D
-
 
A
C
 
V
I
 
I
D
 
D
L
 
N
D
 
A
F
 
F
E
 
E
A
 
G
T
 
-
G
 
G
A
 
Y
A
 
M
C
 
A
A
 
G
D
 
R
H
 
Y
L
 
L
A
 
I
D
 
E
L
 
R
G
 
G
H
 
H
R
 
R
D
 
E
I
 
I
A
 
G
L
 
V
I
 
I
G
 
P
E
 
-
S
 
-
R
 
-
S
 
G
V
 
P
Y
 
L
Q
 
E
R
|
R
R
 
N
T
|
T
G
 
G
F
 
-
A
 
-
A
 
A
R
 
G
T
x
R
L
 
L
E
 
A
G
 
G
F
 
F
R
 
M
Q
 
K
R
 
A
A
 
M
R
 
E
A
 
E
R
 
A
G
 
M
V
 
I
R
 
K
A
 
V
V
 
P
H
 
E
R
 
S
P
 
W
-
 
I
C
 
V
E
 
Q
G
 
G
T
 
D
F
|
F
E
 
E
S
 
P
T
 
E
A
 
S
G
 
G
V
 
Y
-
 
R
-
 
A
L
 
M
T
 
Q
R
 
Q
I
 
I
L
 
L
E
 
S
E
 
Q
R
 
P
P
 
H
E
 
R
T
 
P
S
 
T
G
 
A
F
 
V
V
 
F
V
 
C
Q
 
G
N
 
G
E
 
D
A
 
I
A
 
M
I
 
A
R
 
M
P
 
G
L
 
A
L
 
L
T
 
C
L
 
A
L
 
A
R
 
D
Q
 
E
F
 
M
G
 
G
R
 
L
V
 
R
V
 
V
P
 
P
E
 
Q
D
 
D
A
 
V
S
 
S
V
 
L
V
 
I
A
 
G
I
 
Y
C
x
D
P
 
N
E
 
V
S
 
R
V
 
N
A
 
A
L
 
R
Q
 
Y
S
 
F
S
 
T
P
 
P
Q
 
A
L
 
L
T
 
T
S
 
T
V
 
I
S
 
H
I
 
Q
P
 
P
A
 
K
E
 
D
R
 
S
M
 
L
G
 
G
R
 
E
G
 
T
A
 
A
L
 
F
E
 
N
L
 
M
V
 
L
M
 
L
A
 
D
H
 
R
L
 
I
-
 
V
S
 
N
G
 
K
R
 
R
P
 
E
T
 
E
A
 
P
G
 
Q
T
 
S
T
 
I
L
 
E
I
 
V
A
 
H
P
 
P
E
 
R
L
 
L
A
 
I
V
 
E
R
 
R
E
 
R
S
 
S

2pubA Crystal structure of the laci family member, purr, bound to dna: minor groove binding by alpha helices (see paper)
25% identity, 98% coverage: 3:329/334 of query aligns to 1:328/338 of 2pubA

query
sites
2pubA
T
 
T
L
 
I
A
 
K
E
 
D
V
 
V
A
 
A
A
 
K
R
 
R
A
 
A
G
 
N
V
 
V
S
|
S
A
 
T
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
H
V
 
V
I
 
I
S
 
N
G
 
K
K
 
T
R
|
R
S
 
F
I
x
V
S
x
A
Q
 
E
A
 
E
T
|
T
Q
 
R
D
 
N
R
 
A
V
 
V
L
 
W
R
 
A
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
H
Y
 
Y
H
 
S
P
 
P
N
 
S
A
 
A
S
 
V
A
 
A
R
 
R
A
 
S
L
|
L
A
x
K
S
 
V
S
 
N
R
 
H
S
 
T
N
 
K
V
 
S
I
 
I
A
 
G
L
 
L
M
 
L
V
 
A
P
 
T
L
 
S
R
 
S
S
 
E
D
 
A
M
 
A
Y
|
Y
V
 
-
P
 
-
V
 
-
I
x
F
M
 
A
E
 
E
I
 
I
V
 
I
M
 
E
A
 
A
I
 
V
A
 
E
A
 
K
T
 
N
A
 
C
R
 
F
A
 
Q
H
 
K
G
 
G
Q
 
Y
D
 
T
I
 
L
L
 
I
L
 
L
L
 
G
T
 
N
G
 
A
G
 
W
E
 
N
G
 
N
P
 
L
D
 
E
G
 
K
V
 
Q
R
 
R
-
 
A
-
 
Y
-
 
L
R
 
S
V
 
M
A
 
M
G
 
A
T
 
Q
G
 
K
L
 
R
A
 
V
D
 
D
A
 
G
I
 
L
I
 
L
L
 
V
M
 
M
D
 
C
V
 
S
E
 
E
L
 
Y
D
 
P
D
 
E
K
 
P
R
 
L
I
 
L
P
 
A
V
 
M
L
 
L
R
 
E
E
 
E
A
 
Y
-
 
R
S
 
H
M
 
I
P
 
P
A
 
M
V
 
V
L
 
V
I
 
M
G
 
D
L
 
W
P
 
G
S
 
E
D
 
A
T
 
K
A
 
A
D
 
D
L
 
F
T
 
T
-
 
D
-
 
A
C
 
V
I
 
I
D
 
D
L
 
N
D
 
A
F
 
F
E
 
E
A
 
G
T
 
-
G
 
G
A
 
Y
A
 
M
C
 
A
A
 
G
D
 
R
H
 
Y
L
 
L
A
 
I
D
 
E
L
 
R
G
 
G
H
 
H
R
 
R
D
 
E
I
 
I
A
 
G
L
 
V
I
 
I
G
 
P
-
 
G
-
 
P
-
 
L
E
 
E
S
 
A
R
 
N
S
x
T
V
 
G
Y
 
A
Q
 
G
R
|
R
R
 
L
T
 
A
G
 
G
F
 
F
A
 
M
A
 
K
R
 
A
T
 
M
L
 
E
E
 
E
G
 
A
F
 
M
R
 
I
Q
 
K
R
 
V
A
 
P
R
 
E
A
 
S
R
 
W
G
 
I
V
 
V
R
 
-
A
 
-
V
 
-
H
 
-
R
 
-
P
 
-
C
 
-
E
 
Q
G
 
G
T
 
D
F
|
F
E
 
E
S
 
P
T
 
E
A
 
S
G
 
G
V
 
Y
-
 
R
-
 
A
L
 
M
T
 
Q
R
 
Q
I
 
I
L
 
L
E
 
S
E
 
Q
R
 
P
P
 
H
E
 
R
T
 
P
S
 
T
G
 
A
F
 
V
V
 
F
V
 
C
Q
 
G
N
 
G
E
 
D
A
 
I
A
 
M
I
 
A
R
 
M
P
 
G
L
 
A
L
 
L
T
 
C
L
 
A
L
 
A
R
 
D
Q
 
E
F
 
M
G
 
G
R
 
L
V
 
R
V
 
V
P
 
P
E
 
Q
D
 
D
A
 
V
S
 
S
V
 
L
V
 
I
A
 
G
I
 
Y
C
x
D
P
 
N
E
 
V
S
 
R
V
 
N
A
 
A
L
 
R
Q
 
Y
S
 
F
S
 
T
P
 
P
Q
 
A
L
 
L
T
 
T
S
 
T
V
 
I
S
 
H
I
 
Q
P
 
P
A
 
K
E
 
D
R
 
S
M
 
L
G
 
G
R
 
E
G
 
T
A
 
A
L
 
F
E
 
N
L
 
M
V
 
L
M
 
L
A
 
D
H
 
R
L
 
I
-
 
V
S
 
N
G
 
K
R
 
R
P
 
E
T
 
E
A
 
P
G
 
Q
T
 
S
T
 
I
L
 
E
I
 
V
A
 
H
P
 
P
E
 
R
L
 
L
A
 
I
V
 
E
R
 
R
E
 
R
S
 
S

2puaA Crystal structure of the laci family member, purr, bound to dna: minor groove binding by alpha helices (see paper)
25% identity, 98% coverage: 3:329/334 of query aligns to 2:329/339 of 2puaA

query
sites
2puaA
T
 
T
L
 
I
A
 
K
E
 
D
V
 
V
A
 
A
A
 
K
R
 
R
A
 
A
G
 
N
V
 
V
S
|
S
A
 
T
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
H
V
 
V
I
 
I
S
 
N
G
 
K
K
 
T
R
|
R
S
 
F
I
x
V
S
x
A
Q
 
E
A
 
E
T
|
T
Q
 
R
D
 
N
R
 
A
V
 
V
L
 
W
R
 
A
A
 
A
V
 
I
T
 
K
E
 
E
L
 
L
G
 
H
Y
 
Y
H
 
S
P
 
P
N
 
S
A
 
A
S
 
V
A
 
A
R
 
R
A
 
S
L
|
L
A
x
K
S
 
V
S
 
N
R
 
H
S
 
T
N
 
K
V
 
S
I
 
I
A
 
G
L
 
L
M
 
L
V
 
A
P
 
T
L
 
S
R
 
S
S
 
E
D
 
A
M
 
A
Y
|
Y
V
 
-
P
 
-
V
 
-
I
x
F
M
 
A
E
 
E
I
 
I
V
 
I
M
 
E
A
 
A
I
 
V
A
 
E
A
 
K
T
 
N
A
 
C
R
 
F
A
 
Q
H
 
K
G
 
G
Q
 
Y
D
 
T
I
 
L
L
 
I
L
 
L
L
 
G
T
 
N
G
 
A
G
 
W
E
 
N
G
 
N
P
 
L
D
 
E
G
 
K
V
 
Q
R
 
R
-
 
A
-
 
Y
-
 
L
R
 
S
V
 
M
A
 
M
G
 
A
T
 
Q
G
 
K
L
 
R
A
 
V
D
 
D
A
 
G
I
 
L
I
 
L
L
 
V
M
 
M
D
 
C
V
 
S
E
 
E
L
 
Y
D
 
P
D
 
E
K
 
P
R
 
L
I
 
L
P
 
A
V
 
M
L
 
L
R
 
E
E
 
E
A
 
Y
-
 
R
S
 
H
M
 
I
P
 
P
A
 
M
V
 
V
L
 
V
I
 
M
G
 
D
L
 
W
P
 
G
S
 
E
D
 
A
T
 
K
A
 
A
D
 
D
L
 
F
T
 
T
-
 
D
-
 
A
C
 
V
I
 
I
D
 
D
L
 
N
D
 
A
F
 
F
E
 
E
A
 
G
T
 
-
G
 
G
A
 
Y
A
 
M
C
 
A
A
 
G
D
 
R
H
 
Y
L
 
L
A
 
I
D
 
E
L
 
R
G
 
G
H
 
H
R
 
R
D
 
E
I
 
I
A
 
G
L
 
V
I
 
I
G
 
P
-
 
G
-
 
P
-
 
L
E
 
E
S
 
A
R
 
N
S
x
T
V
 
G
Y
 
A
Q
 
G
R
|
R
R
 
L
T
 
A
G
 
G
F
 
F
A
 
M
A
 
K
R
 
A
T
 
M
L
 
E
E
 
E
G
 
A
F
 
M
R
 
I
Q
 
K
R
 
V
A
 
P
R
 
E
A
 
S
R
 
W
G
 
I
V
 
V
R
 
-
A
 
-
V
 
-
H
 
-
R
 
-
P
 
-
C
 
-
E
 
Q
G
 
G
T
 
D
F
|
F
E
 
E
S
 
P
T
 
E
A
 
S
G
 
G
V
 
Y
-
 
R
-
 
A
L
 
M
T
 
Q
R
 
Q
I
 
I
L
 
L
E
 
S
E
 
Q
R
 
P
P
 
H
E
 
R
T
 
P
S
 
T
G
 
A
F
 
V
V
 
F
V
 
C
Q
 
G
N
 
G
E
 
D
A
 
I
A
 
M
I
 
A
R
 
M
P
 
G
L
 
A
L
 
L
T
 
C
L
 
A
L
 
A
R
 
D
Q
 
E
F
 
M
G
 
G
R
 
L
V
 
R
V
 
V
P
 
P
E
 
Q
D
 
D
A
 
V
S
 
S
V
 
L
V
 
I
A
 
G
I
 
Y
C
x
D
P
 
N
E
 
V
S
 
R
V
 
N
A
 
A
L
 
R
Q
 
Y
S
 
F
S
 
T
P
 
P
Q
 
A
L
 
L
T
 
T
S
 
T
V
 
I
S
 
H
I
 
Q
P
 
P
A
 
K
E
 
D
R
 
S
M
 
L
G
 
G
R
 
E
G
 
T
A
 
A
L
 
F
E
 
N
L
 
M
V
 
L
M
 
L
A
 
D
H
 
R
L
 
I
-
 
V
S
 
N
G
 
K
R
 
R
P
 
E
T
 
E
A
 
P
G
 
Q
T
 
S
T
 
I
L
 
E
I
 
V
A
 
H
P
 
P
E
 
R
L
 
L
A
 
I
V
 
E
R
 
R
E
 
R
S
 
S

P21867 HTH-type transcriptional regulator RafR; Raffinose operon repressor; raf repressor from Escherichia coli (see paper)
30% identity, 58% coverage: 2:195/334 of query aligns to 1:200/336 of P21867

query
sites
P21867
V
x
M
T
 
S
L
 
L
A
 
K
E
 
A
V
 
I
A
 
A
A
 
T
R
 
T
A
 
L
G
 
G
V
 
I
S
 
S
A
 
V
S
 
T
T
 
T
V
 
V
S
 
S
Y
 
R
V
 
A
I
 
L
S
 
G
G
 
G
K
 
F
R
 
S
S
 
D
I
 
V
S
 
A
Q
 
A
A
 
S
T
 
T
Q
 
R
D
 
E
R
 
R
V
 
V
L
 
E
R
 
A
A
 
E
V
 
A
T
 
R
E
 
R
L
 
R
G
 
G
Y
 
Y
H
 
R
P
 
P
N
 
N
A
 
T
S
 
Q
A
|
A
R
 
R
A
 
R
L
 
L
A
 
K
S
 
T
S
 
G
R
 
K
S
 
T
N
 
D
V
 
A
I
 
I
A
 
G
L
 
L
M
 
V
V
 
Y
P
 
P
L
 
E
R
 
N
S
 
D
D
 
-
M
 
-
Y
 
-
V
 
V
P
 
P
-
 
F
-
 
N
-
 
S
-
 
G
V
 
V
I
 
F
M
 
M
E
 
D
I
 
M
V
 
V
M
 
S
A
 
C
I
 
I
A
 
S
A
 
R
T
 
E
A
 
L
R
 
A
A
 
Y
H
 
H
G
 
D
Q
 
I
D
 
D
I
 
L
L
 
L
L
 
L
L
 
I
T
 
A
G
 
D
G
 
D
E
 
E
G
 
H
P
 
A
D
 
D
-
 
C
-
 
H
G
 
S
V
 
Y
R
 
M
R
 
R
V
 
L
A
 
V
G
 
E
T
 
S
G
 
R
L
 
R
A
 
I
D
 
D
A
 
A
I
 
L
I
 
I
L
 
I
M
 
A
D
 
H
V
 
T
E
 
L
L
 
D
D
 
D
D
 
D
K
 
P
R
 
R
I
 
I
P
 
T
V
 
H
L
 
L
R
 
H
E
 
K
A
 
A
S
 
G
M
 
I
P
 
P
A
 
F
V
 
L
L
 
A
I
 
L
G
 
G
L
 
R
P
 
V
S
 
P
D
 
Q
T
 
G
A
 
L
D
 
P
L
 
C
T
 
A
C
 
W
I
 
F
D
 
D
L
 
F
D
 
D
F
 
N
E
 
H
A
 
A
T
 
G
G
 
T
A
 
W
A
 
Q
C
 
A
A
 
T
D
 
Q
H
 
K
L
 
L
A
 
I
D
 
A
L
 
L
G
 
G
H
 
H
R
 
K
D
 
S
I
 
I
A
 
A
L
 
L
I
 
L
G
 
S
E
 
E
S
 
N
R
 
T
S
 
S
-
 
H
-
 
S
-
 
Y
V
 
V
Y
 
I
Q
 
A
R
 
R
R
 
R
T
 
Q
G
 
G
F
 
W

7ce1K Complex structure of transcription factor sghr with its cognate DNA (see paper)
23% identity, 93% coverage: 3:313/334 of query aligns to 4:314/333 of 7ce1K

query
sites
7ce1K
T
 
T
L
|
L
A
 
K
E
 
T
V
 
I
A
 
A
A
 
Y
R
 
M
A
 
T
G
 
G
V
 
L
S
x
G
A
 
I
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
R
V
 
A
I
 
L
S
x
K
G
 
D
K
 
A
R
 
P
S
x
D
I
|
I
S
x
G
Q
 
A
A
 
E
T
|
T
Q
 
K
D
 
E
R
 
R
V
 
V
L
 
R
R
 
L
A
 
I
V
 
A
T
 
Q
E
 
Q
L
 
I
G
 
G
Y
|
Y
H
 
Q
P
|
P
N
|
N
A
 
R
S
 
A
A
x
G
R
x
V
A
 
R
L
|
L
A
x
R
S
 
T
S
 
G
R
 
K
S
 
T
N
 
N
V
 
V
I
 
I
A
 
A
L
 
L
M
 
V
V
 
L
P
 
S
L
 
V
R
 
D
S
 
E
D
 
E
M
 
L
-
 
M
-
 
G
Y
 
F
V
 
T
P
 
S
V
 
Q
I
 
M
M
 
V
E
 
F
I
 
G
V
 
I
M
 
T
A
 
E
I
 
V
A
 
L
A
 
A
T
 
T
A
 
T
R
 
Q
A
 
Y
H
 
H
G
 
-
Q
 
-
D
 
-
I
 
L
L
 
V
L
 
V
L
 
T
T
 
P
G
 
H
G
 
T
E
 
H
G
 
A
P
 
K
D
 
D
G
 
S
-
 
M
-
 
V
-
 
P
V
 
I
R
 
R
R
 
Y
V
 
I
A
 
L
G
 
E
T
 
T
G
 
G
L
 
S
A
 
A
D
 
D
A
 
G
I
 
V
I
 
I
L
 
I
M
 
S
D
 
K
V
 
I
E
 
E
L
 
P
D
 
N
D
 
D
K
 
P
R
 
R
I
 
V
P
 
R
V
 
F
L
 
M
R
 
T
E
 
E
A
 
R
S
 
K
M
 
M
P
 
P
A
 
F
V
 
V
L
 
T
I
 
H
G
 
G
L
 
R
P
 
S
S
 
D
D
 
M
T
 
G
A
 
I
D
 
E
L
 
H
T
 
A
C
 
Y
I
 
H
D
 
D
L
 
F
D
 
D
F
 
N
E
 
E
A
 
A
T
 
Y
G
 
A
A
 
Y
A
 
E
C
 
A
A
 
V
D
 
E
H
x
R
L
 
L
A
 
A
D
 
Q
L
 
C
G
 
G
H
 
R
R
 
K
D
 
R
I
 
I
A
 
A
L
 
I
I
 
I
G
 
-
E
 
-
S
 
-
R
 
-
S
 
-
V
 
V
Y
 
P
Q
 
P
R
 
S
R
 
R
T
 
F
G
 
A
F
 
F
A
 
H
A
 
D
R
 
H
T
 
A
L
 
R
E
 
K
G
 
G
F
 
F
R
 
T
Q
 
R
R
 
G
A
 
I
R
 
R
A
 
D
R
 
F
G
 
G
V
 
V
R
 
S
A
 
E
V
 
F
H
 
-
R
 
-
P
 
P
C
 
L
E
 
D
G
 
A
-
 
I
T
 
T
F
 
I
E
 
E
S
 
T
T
 
P
A
 
L
G
 
D
V
 
K
L
 
I
-
 
R
-
 
D
-
 
F
-
 
G
T
 
K
R
 
R
I
 
L
L
 
M
E
 
Q
E
 
S
R
 
D
P
 
D
E
 
R
T
 
P
S
 
D
G
 
G
F
 
I
V
 
V
V
 
S
Q
 
I
N
 
S
E
 
G
A
 
S
A
 
S
I
 
T
R
 
I
P
 
A
L
 
L
L
 
V
T
 
A
L
 
G
L
 
F
R
 
E
Q
 
A
F
 
A
G
 
G
R
 
V
V
 
R
V
 
I
P
 
G
E
 
K
D
 
D
A
 
I
S
 
D
V
 
I
V
 
V
A
 
S
I
 
K
C
 
Q
P
 
S
E
 
A
S
x
E
V
 
F
A
 
L
L
x
N
Q
x
W
S
 
I
S
 
Q
P
 
P
Q
 
Q
L
 
I
T
 
H
S
 
T
V
 
V
S
 
N
I
 
E
P
 
D
A
 
I
E
 
K
R
 
L
M
 
A
G
 
G
R
 
R
G
 
E
A
 
L
L
 
A
E
 
K
L
 
A
V
 
L
M
 
L
A
 
A
H
 
R
L
 
I
S
 
N
G
 
G
R
 
A
P
 
P

Sites not aligning to the query:

1lbgA Lactose operon repressor bound to 21-base pair symmetric operator DNA, alpha carbons only (see paper)
24% identity, 99% coverage: 2:332/334 of query aligns to 4:331/357 of 1lbgA

query
sites
1lbgA
V
 
V
T
 
T
L
 
L
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
E
R
 
Y
A
 
A
G
 
G
V
 
V
S
 
S
A
 
Y
S
 
Q
T
 
T
V
 
V
S
 
S
Y
 
R
V
 
V
I
 
V
S
 
N
G
 
Q
K
 
A
R
 
S
S
 
H
I
x
V
S
|
S
Q
 
A
A
 
K
T
 
T
Q
 
R
D
 
E
R
 
K
V
 
V
L
 
E
R
 
A
A
 
A
V
 
M
T
 
A
E
 
E
L
 
L
G
 
N
Y
 
Y
H
 
I
P
 
P
N
 
N
A
 
R
S
 
V
A
 
A
R
 
Q
A
 
Q
L
 
L
A
 
A
S
 
G
S
 
K
R
 
Q
S
 
S
N
 
L
V
 
L
I
 
I
A
 
G
L
 
V
M
 
A
V
 
T
P
 
-
L
 
-
R
 
-
S
 
S
D
 
S
M
 
L
Y
 
A
V
 
L
P
 
H
V
 
A
I
 
P
M
 
S
E
 
Q
I
 
I
V
 
V
M
 
A
A
 
A
I
 
I
A
 
K
A
 
S
T
 
R
A
 
A
R
 
D
A
 
Q
H
 
L
G
 
G
Q
 
A
D
 
S
I
 
V
L
 
V
L
 
V
-
 
S
L
 
M
T
 
V
G
 
E
G
 
R
E
 
S
G
 
G
P
 
V
D
 
E
G
 
A
V
 
C
R
 
K
R
 
T
V
 
A
A
 
V
G
 
H
T
 
N
G
 
L
L
 
L
A
 
A
D
 
Q
A
 
R
I
 
V
-
 
S
-
 
G
I
 
L
L
 
I
M
 
I
D
 
N
V
 
Y
E
 
P
L
 
L
D
 
D
D
 
D
K
 
Q
R
 
D
I
 
A
P
 
I
V
 
A
L
 
V
R
 
E
E
 
A
A
 
A
-
 
C
-
 
T
S
 
N
M
 
V
P
 
P
A
 
A
V
 
L
L
 
F
I
 
L
G
 
D
L
 
V
P
 
-
S
 
S
D
 
D
T
 
Q
A
 
T
D
 
P
L
 
I
T
 
N
C
 
S
I
 
I
D
 
I
L
 
F
D
 
S
F
 
H
E
 
E
A
 
D
T
 
G
G
 
T
A
 
R
A
 
L
C
 
G
A
 
V
D
 
E
H
 
H
L
 
L
A
 
V
D
 
A
L
 
L
G
 
G
H
 
H
R
 
Q
D
 
Q
I
 
I
A
 
A
L
 
L
I
 
L
G
 
A
E
 
G
S
 
P
R
 
L
S
 
S
V
 
S
Y
 
V
Q
 
S
R
 
A
R
 
R
T
 
L
G
 
R
F
 
L
A
 
A
A
 
-
R
 
-
T
 
-
L
 
-
E
 
-
G
 
G
F
 
W
R
 
H
Q
 
K
R
 
Y
A
 
L
R
 
T
A
 
R
R
 
N
G
 
Q
V
 
I
R
 
Q
A
 
P
V
 
I
H
 
A
R
 
E
P
 
R
C
 
-
E
 
E
G
 
G
T
 
D
F
 
W
E
 
S
S
 
A
T
 
M
A
 
S
G
 
G
V
 
F
-
 
Q
-
 
Q
L
 
T
T
 
M
R
 
Q
I
 
M
L
 
L
E
 
N
E
 
E
R
 
G
P
 
I
E
 
V
T
 
P
S
 
T
G
 
A
F
 
M
V
 
L
V
 
V
Q
 
A
N
 
N
E
 
D
A
 
Q
A
 
M
I
 
A
R
 
L
P
 
G
L
 
A
L
 
M
T
 
R
L
 
A
L
 
I
R
 
T
Q
 
E
F
 
S
G
 
G
R
 
L
V
 
R
V
 
V
P
 
G
E
 
A
D
 
D
A
 
I
S
 
S
V
 
V
V
 
V
A
 
G
I
 
Y
C
 
D
P
 
D
E
 
T
S
 
E
V
 
D
A
 
S
L
 
S
Q
 
C
S
 
Y
S
 
I
P
 
P
Q
 
P
L
 
L
T
 
T
S
 
T
V
 
I
S
 
K
I
 
Q
P
 
D
A
 
F
E
 
R
R
 
L
M
 
L
G
 
G
R
 
Q
G
 
T
A
 
S
L
 
V
E
 
D
L
 
R
V
 
L
M
 
L
A
 
Q
H
 
L
L
 
S
S
 
Q
G
 
G
R
 
Q
P
 
A
T
 
V
A
 
K
G
 
G
T
 
N
T
 
Q
L
 
L
I
 
L
A
 
P
P
 
V
E
 
S
L
 
L
A
 
V
V
 
K
R
 
R
E
 
K
S
 
T
S
 
T
L
 
L
S
 
A

2o20B Crystal structure of transcription regulator ccpa of lactococcus lactis (see paper)
25% identity, 75% coverage: 54:305/334 of query aligns to 1:248/275 of 2o20B

query
sites
2o20B
L
 
L
A
 
A
S
 
S
S
 
K
R
 
R
S
 
T
N
 
T
V
 
T
I
 
V
A
 
G
L
 
V
M
 
I
V
 
L
P
 
P
L
 
T
R
 
I
S
 
T
D
 
S
M
 
T
Y
 
Y
V
 
F
P
 
A
V
 
A
I
 
I
M
 
T
E
 
R
I
 
G
V
 
V
M
 
D
A
 
D
I
 
I
A
 
A
A
 
S
T
 
-
A
 
-
R
 
-
A
 
M
H
 
Y
G
 
K
Q
 
Y
D
 
N
I
 
M
L
 
I
L
 
L
L
 
A
T
 
N
G
 
S
G
 
D
E
 
N
G
 
D
P
 
V
D
 
E
G
 
K
V
 
E
R
 
E
R
 
K
V
 
V
A
 
L
G
 
E
T
 
T
G
 
F
L
 
L
A
 
S
-
 
K
-
 
Q
-
 
V
D
 
D
A
 
G
I
 
I
I
 
V
L
 
Y
M
 
M
D
 
G
V
x
S
E
 
S
L
 
L
D
 
D
D
 
E
K
 
K
R
 
I
I
 
R
P
 
T
V
 
S
L
 
L
R
 
K
E
 
N
A
 
S
S
 
R
M
 
T
P
 
P
A
 
V
V
 
V
L
 
L
I
 
V
G
 
G
L
 
T
P
 
I
S
 
D
D
 
G
T
 
D
A
 
K
D
 
E
L
 
I
T
 
P
C
 
S
I
 
V
D
 
N
L
 
I
D
 
D
F
 
Y
E
 
H
A
 
L
T
 
A
G
 
A
A
 
Y
A
 
Q
C
 
S
A
 
T
D
 
K
H
 
K
L
 
L
A
 
I
D
 
D
L
 
S
G
 
G
H
 
N
R
 
K
D
 
K
I
 
I
A
 
A
L
 
Y
I
 
I
-
 
M
G
 
G
E
 
S
S
 
L
R
 
K
S
 
D
V
 
V
-
 
E
-
x
N
Y
 
T
Q
 
E
R
 
R
R
 
M
T
 
V
G
 
G
F
 
Y
A
 
Q
A
 
E
R
 
A
T
 
L
L
 
L
E
 
E
G
 
A
-
 
N
-
 
I
-
 
E
F
 
F
R
 
D
Q
 
E
R
 
N
A
 
L
R
 
V
A
 
F
R
 
E
G
 
G
V
 
-
R
 
-
A
 
-
V
 
-
H
 
-
R
 
-
P
 
-
C
 
-
E
 
N
G
x
Y
T
 
S
F
 
Y
E
 
E
S
 
Q
T
 
G
A
 
K
G
 
A
V
 
L
L
 
A
T
x
E
R
 
R
I
 
L
L
 
L
E
 
-
E
 
E
R
 
R
P
 
G
E
 
A
T
 
T
S
 
S
G
 
A
F
 
V
V
 
V
V
 
S
Q
x
H
N
 
D
E
 
T
A
 
V
A
 
A
I
 
V
R
 
-
P
 
G
L
 
L
L
 
L
T
 
S
L
 
A
L
 
M
R
 
M
Q
 
D
F
x
K
G
 
G
R
 
V
V
 
K
V
 
V
P
 
P
E
 
E
D
 
D
A
 
F
S
 
E
V
 
I
V
 
I
A
 
S
I
 
G
C
 
A
P
 
N
E
 
S
S
 
P
V
 
I
A
 
T
L
 
Q
Q
 
Y
S
 
T
S
 
Y
P
 
P
Q
 
T
L
 
L
T
 
T
S
 
S
V
 
V
S
 
N
I
 
Q
P
 
P
A
 
L
E
 
Y
R
 
D
M
 
L
G
 
G
R
 
A
G
 
V
A
 
A
L
 
M
E
 
R
L
 
L
V
 
L

1efaA Crystal structure of the lac repressor dimer bound to operator and the anti-inducer onpf (see paper)
24% identity, 99% coverage: 2:330/334 of query aligns to 3:328/328 of 1efaA

query
sites
1efaA
V
 
V
T
 
T
L
|
L
A
x
Y
E
 
D
V
 
V
A
 
A
A
 
E
R
 
Y
A
 
A
G
 
G
V
 
V
S
|
S
A
x
Y
S
x
Q
T
|
T
V
 
V
S
|
S
Y
x
R
V
 
V
I
 
V
S
x
N
G
 
Q
K
 
A
R
 
S
S
 
H
I
 
V
S
 
S
Q
 
A
A
 
K
T
 
T
Q
 
R
D
 
E
R
 
K
V
 
V
L
 
E
R
 
A
A
 
A
V
 
M
T
 
A
E
 
E
L
 
L
G
 
N
Y
|
Y
H
 
I
P
 
P
N
|
N
A
 
R
S
 
V
A
|
A
R
x
Q
A
 
Q
L
|
L
A
|
A
S
 
G
S
x
K
R
 
Q
S
 
S
N
 
L
V
 
L
I
 
I
A
 
G
L
 
V
M
 
A
V
 
T
P
 
-
L
 
-
R
 
-
S
 
S
D
 
S
M
 
L
Y
 
A
V
 
L
P
 
H
V
x
A
I
 
P
M
 
S
E
 
Q
I
 
I
V
 
V
M
 
A
A
 
A
I
 
I
A
 
K
A
 
S
T
 
R
A
 
A
R
 
D
A
 
Q
H
 
L
G
 
G
Q
 
A
D
 
S
I
 
V
L
 
V
L
 
V
-
 
S
L
 
M
T
 
V
G
 
E
G
 
R
E
 
S
G
 
G
P
 
V
D
 
E
G
 
A
V
 
C
R
 
K
R
 
T
V
 
A
A
 
V
G
 
H
T
 
N
G
 
L
L
 
L
A
 
A
D
 
Q
A
 
R
I
 
V
-
 
S
-
 
G
I
 
L
L
 
I
M
 
I
D
 
N
V
 
Y
E
 
P
L
 
L
D
 
D
D
 
D
K
 
Q
R
 
D
I
 
A
P
 
I
V
 
A
L
 
V
R
 
E
E
 
A
A
 
A
-
 
C
-
 
T
S
 
N
M
 
V
P
 
P
A
 
A
V
 
L
L
 
F
I
 
L
G
x
D
L
 
V
P
 
-
S
 
S
D
 
D
T
 
Q
A
 
T
D
 
P
L
 
I
T
 
N
C
 
S
I
 
I
D
 
I
L
x
F
D
 
S
F
 
H
E
 
E
A
 
D
T
 
G
G
 
T
A
 
R
A
 
L
C
 
G
A
 
V
D
 
E
H
 
H
L
 
L
A
 
V
D
 
A
L
 
L
G
 
G
H
 
H
R
 
Q
D
 
Q
I
 
I
A
 
A
L
 
L
I
 
L
G
 
A
E
 
G
S
 
P
R
 
L
S
 
S
V
 
S
Y
 
V
Q
x
S
R
 
A
R
 
R
T
 
L
G
x
R
F
 
L
A
 
A
A
 
-
R
 
-
T
 
-
L
 
-
E
 
-
G
 
G
F
 
W
R
 
H
Q
 
K
R
 
Y
A
 
L
R
 
T
A
 
R
R
 
N
G
 
Q
V
 
I
R
 
Q
A
 
P
V
 
I
H
 
A
R
 
E
P
 
R
C
 
-
E
 
E
G
 
G
T
 
D
F
 
W
E
 
S
S
 
A
T
 
M
A
 
S
G
 
G
V
 
F
-
 
Q
-
 
Q
L
 
T
T
 
M
R
 
Q
I
 
M
L
 
L
E
 
N
E
 
E
R
 
G
P
 
I
E
 
V
T
 
P
S
 
T
G
 
A
F
 
M
V
 
L
V
 
V
Q
 
A
N
|
N
E
 
D
A
 
Q
A
 
M
I
 
A
R
 
L
P
 
G
L
 
A
L
 
M
T
 
R
L
 
A
L
 
I
R
 
T
Q
 
E
F
 
S
G
 
G
R
 
L
V
 
R
V
 
V
P
 
G
E
 
A
D
 
D
A
 
I
S
 
S
V
 
V
V
 
V
A
 
G
I
 
Y
C
x
D
P
 
D
E
 
T
S
 
E
V
 
D
A
 
S
L
 
S
Q
 
C
S
 
Y
S
 
I
P
 
P
Q
 
P
L
 
L
T
 
T
S
 
T
V
 
I
S
 
K
I
 
Q
P
 
D
A
x
F
E
 
R
R
 
L
M
 
L
G
 
G
R
 
Q
G
 
T
A
 
S
L
 
V
E
 
D
L
 
R
V
 
L
M
 
L
A
 
Q
H
 
L
L
 
S
S
 
Q
G
 
G
R
 
Q
P
 
A
T
 
V
A
 
K
G
 
G
T
 
N
T
 
Q
L
 
L
I
 
L
A
 
P
P
 
V
E
 
S
L
 
L
A
 
V
V
 
K
R
 
R
E
 
K
S
 
T
S
 
T

3k4hA Crystal structure of putative transcriptional regulator laci from bacillus cereus subsp. Cytotoxis nvh 391-98
24% identity, 75% coverage: 75:323/334 of query aligns to 20:270/282 of 3k4hA

query
sites
3k4hA
P
 
P
V
x
F
I
x
F
M
 
P
E
 
E
I
 
V
V
 
I
M
 
R
A
 
G
I
 
I
A
 
S
A
 
S
T
 
F
A
 
A
R
 
H
A
 
V
H
 
E
G
 
G
Q
 
Y
D
 
A
I
 
L
L
 
Y
L
 
M
L
 
S
T
 
T
G
 
G
G
 
E
-
 
T
-
 
E
-
 
E
E
 
E
G
 
I
P
 
F
D
 
N
G
 
G
V
 
V
R
 
V
R
 
K
V
 
M
A
 
V
G
 
Q
T
 
G
G
 
R
L
 
Q
A
 
I
D
 
G
A
 
G
I
 
I
I
 
I
L
 
L
M
x
L
D
 
Y
V
 
S
E
 
R
L
 
E
D
 
N
D
 
D
K
 
R
R
 
I
I
 
I
P
 
Q
V
 
Y
L
 
L
R
 
H
E
 
E
A
 
Q
S
 
N
M
 
F
P
 
P
A
 
F
V
 
V
L
 
L
I
|
I
G
|
G
L
 
K
P
 
P
S
 
Y
D
 
D
T
 
R
A
 
K
D
 
D
-
 
E
L
 
I
T
 
T
C
 
Y
I
 
V
D
|
D
L
x
N
D
 
D
F
x
N
E
 
Y
A
 
T
T
 
A
G
 
A
A
 
R
A
 
E
C
 
V
A
 
A
D
 
E
H
 
Y
L
 
L
A
 
I
D
 
S
L
 
L
G
 
G
H
 
H
R
 
K
D
 
Q
I
 
I
A
 
A
L
 
F
I
 
I
G
 
G
E
 
G
S
 
G
R
 
S
S
 
D
V
 
L
Y
 
L
Q
x
V
R
 
T
R
 
R
T
 
D
G
x
R
F
 
L
A
 
A
A
 
G
R
 
M
T
 
S
L
 
-
E
 
-
G
 
-
F
 
-
R
 
-
Q
 
-
R
 
-
A
 
-
R
 
D
A
 
A
R
 
L
G
 
K
V
 
L
R
 
A
A
 
D
V
 
I
H
 
V
R
 
L
P
 
P
C
 
K
E
 
E
G
 
Y
T
 
I
F
 
L
-
 
H
-
 
F
-
 
D
-
x
F
-
 
S
-
 
R
E
 
E
S
 
S
T
 
G
A
 
Q
G
 
Q
V
 
A
L
 
V
T
 
E
R
 
E
I
 
L
L
 
M
E
 
G
E
 
L
R
 
Q
P
 
Q
E
 
P
T
 
P
S
 
T
G
 
A
F
 
I
V
 
M
V
 
A
Q
 
T
N
x
D
E
 
D
A
 
L
A
 
I
I
 
G
R
 
L
P
 
G
L
 
V
L
 
L
T
 
S
L
 
A
L
 
L
R
 
S
Q
 
K
F
 
K
G
 
G
R
 
F
V
 
V
V
 
V
P
 
P
E
 
K
D
 
D
A
 
V
S
 
S
V
 
I
V
 
V
A
 
S
I
 
F
C
x
N
P
 
N
E
 
A
S
 
L
V
 
L
A
 
S
L
 
E
Q
 
I
S
 
A
S
 
S
P
 
P
Q
 
P
L
 
L
T
 
S
S
 
T
V
 
V
S
 
D
I
 
V
P
 
N
A
 
I
E
 
Y
R
 
Q
M
 
L
G
 
G
R
 
Y
G
 
E
A
 
A
L
 
A
E
 
K
L
 
A
V
 
L
M
 
V
A
 
D
H
 
K
L
 
V
S
 
E
G
 
N
R
 
A
P
 
E
T
 
S
A
 
T
G
 
A
T
 
K
T
 
C
L
 
I
I
 
I
A
 
I
P
 
P
E
 
H

7ce1T Complex structure of transcription factor sghr with its cognate DNA (see paper)
26% identity, 63% coverage: 3:212/334 of query aligns to 4:204/292 of 7ce1T

query
sites
7ce1T
T
|
T
L
|
L
A
 
K
E
 
T
V
 
I
A
 
A
A
 
Y
R
 
M
A
 
T
G
 
G
V
 
L
S
x
G
A
 
I
S
x
T
T
|
T
V
 
V
S
 
S
Y
 
R
V
 
A
I
 
L
S
x
K
G
 
D
K
 
A
R
 
P
S
x
D
I
|
I
S
x
G
Q
 
A
A
 
E
T
|
T
Q
 
K
D
 
E
R
 
R
V
 
V
L
 
R
R
 
L
A
 
I
V
 
A
T
 
Q
E
 
Q
L
 
I
G
 
G
Y
 
Y
H
 
Q
P
|
P
N
|
N
A
 
R
S
 
A
A
 
G
R
x
V
A
 
R
L
|
L
A
x
R
S
 
T
S
 
G
R
 
K
S
 
T
N
 
N
V
 
V
I
 
I
A
 
A
L
 
L
M
 
V
V
 
L
P
 
S
L
 
V
R
 
D
S
 
E
D
 
E
M
 
L
-
 
M
-
 
G
Y
 
F
V
 
T
P
 
S
V
 
Q
I
 
M
M
 
V
E
 
F
I
 
G
V
 
I
M
 
T
A
 
E
I
 
V
A
 
L
A
 
A
T
 
T
A
 
T
R
 
Q
A
 
Y
H
 
H
G
 
-
Q
 
-
D
 
-
I
 
L
L
 
V
L
 
V
L
 
T
T
 
P
G
 
H
G
 
T
E
 
H
G
 
A
P
 
K
D
 
D
G
 
S
-
 
M
-
 
V
-
 
P
V
 
I
R
 
R
R
 
Y
V
 
I
A
 
L
G
 
E
T
 
T
G
 
G
L
 
S
A
 
A
D
 
D
A
 
G
I
 
V
I
 
I
L
 
I
M
 
S
D
 
K
V
 
I
E
 
E
L
 
P
D
 
N
D
 
D
K
 
P
R
 
R
I
 
V
P
 
R
V
 
F
L
 
M
R
 
T
E
 
E
A
 
R
S
 
K
M
 
M
P
 
P
A
 
F
V
 
V
L
 
T
I
 
H
G
 
G
L
 
R
P
 
-
S
 
S
D
 
D
T
 
M
A
 
G
D
 
I
L
 
E
T
 
H
C
 
A
I
 
Y
D
 
H
L
 
D
D
 
D
F
 
N
E
 
E
A
 
A
T
 
Y
G
 
A
A
 
Y
A
 
E
C
 
A
A
 
V
D
 
E
H
 
R
L
 
L
A
 
A
D
 
Q
L
 
C
G
 
G
H
 
-
R
 
-
D
 
-
I
 
-
A
 
-
L
 
-
I
 
-
G
 
-
E
 
-
S
 
-
R
 
R
S
 
K
V
 
V
Y
 
P
Q
 
P
R
 
S
R
 
R
T
 
F
G
 
A
F
 
F
A
 
H
A
 
D
R
 
H
T
 
A
L
 
R
E
 
K
G
 
G
F
 
F
R
 
T
Q
 
R
R
 
G
A
 
I
R
 
R
A
 
D
R
 
F
G
 
G
V
 
V

2pe5A Crystal structure of the lac repressor bound to onpg in repressed state (see paper)
24% identity, 99% coverage: 2:330/334 of query aligns to 3:328/328 of 2pe5A

query
sites
2pe5A
V
 
V
T
|
T
L
|
L
A
 
Y
E
 
D
V
 
V
A
 
A
A
 
E
R
 
Y
A
 
A
G
 
G
V
 
V
S
|
S
A
x
Y
S
x
Q
T
|
T
V
 
V
S
 
S
Y
x
R
V
 
V
I
 
V
S
 
N
G
 
Q
K
 
A
R
 
S
S
 
H
I
 
V
S
|
S
Q
 
A
A
 
K
T
|
T
Q
 
R
D
 
E
R
 
K
V
 
V
L
 
E
R
 
A
A
 
A
V
 
M
T
 
A
E
 
E
L
 
L
G
 
N
Y
|
Y
H
 
I
P
|
P
N
|
N
A
 
R
S
 
V
A
|
A
R
x
Q
A
 
Q
L
|
L
A
|
A
S
 
G
S
 
K
R
 
Q
S
 
L
N
 
L
V
 
L
I
 
I
A
 
G
L
 
V
M
 
A
V
 
T
P
 
-
L
 
-
R
 
-
S
 
S
D
 
S
M
 
L
Y
 
A
V
x
L
P
 
H
V
x
A
I
x
P
M
 
S
E
 
Q
I
 
I
V
 
V
M
 
A
A
 
A
I
 
I
A
 
K
A
 
S
T
 
R
A
 
A
R
 
D
A
 
Q
H
 
L
G
 
G
Q
 
A
D
 
S
I
 
V
L
 
V
L
 
V
-
 
S
L
 
M
T
 
V
G
 
E
G
 
R
E
 
S
G
 
G
P
 
V
D
 
E
G
 
A
V
 
C
R
 
K
R
 
A
V
 
A
A
 
V
G
 
H
T
 
N
G
 
L
L
 
L
A
 
A
D
 
Q
A
 
R
I
 
V
-
 
S
-
 
G
I
 
L
L
 
I
M
 
I
D
 
N
V
 
Y
E
 
P
L
 
L
D
 
D
D
 
D
K
 
Q
R
 
D
I
 
A
P
 
I
V
 
A
L
 
V
R
 
E
E
 
A
A
 
A
-
 
C
-
 
T
S
 
N
M
 
V
P
 
P
A
 
A
V
 
L
L
 
F
I
 
L
G
 
D
L
 
V
P
 
-
S
 
S
D
 
D
T
 
Q
A
 
T
D
 
P
L
 
I
T
 
N
C
 
S
I
 
I
D
 
I
L
x
F
D
 
S
F
 
H
E
 
E
A
 
D
T
 
G
G
 
T
A
 
R
A
 
L
C
 
G
A
 
V
D
 
E
H
 
H
L
 
L
A
 
V
D
 
A
L
 
L
G
 
G
H
 
H
R
 
Q
D
 
Q
I
 
I
A
 
A
L
 
L
I
 
L
G
 
A
E
 
G
S
 
P
R
 
L
S
 
S
V
 
S
Y
 
V
Q
 
S
R
 
A
R
 
R
T
 
L
G
x
R
F
 
L
A
 
A
A
 
-
R
 
-
T
 
-
L
 
-
E
 
-
G
 
G
F
 
W
R
 
H
Q
 
K
R
 
Y
A
 
L
R
 
T
A
 
R
R
 
N
G
 
Q
V
 
I
R
 
Q
A
 
P
V
 
I
H
 
A
R
 
E
P
 
R
C
 
-
E
 
E
G
 
G
T
 
D
F
x
W
E
 
S
S
 
A
T
 
M
A
 
S
G
 
G
V
 
F
-
 
Q
-
 
Q
L
 
T
T
 
M
R
 
Q
I
 
M
L
 
L
E
 
N
E
 
E
R
 
G
P
 
I
E
 
V
T
 
P
S
 
T
G
 
A
F
 
M
V
 
L
V
 
V
Q
 
A
N
|
N
E
 
D
A
 
Q
A
 
M
I
 
A
R
 
L
P
 
G
L
 
A
L
 
M
T
 
R
L
 
A
L
 
I
R
 
T
Q
 
E
F
 
S
G
 
G
R
 
L
V
 
R
V
 
V
P
 
G
E
 
A
D
 
D
A
 
I
S
 
S
V
 
V
V
 
V
A
 
G
I
 
Y
C
x
D
P
 
D
E
 
T
S
 
E
V
 
D
A
 
S
L
 
S
Q
 
C
S
 
Y
S
 
I
P
 
P
Q
 
P
L
 
L
T
 
T
S
 
T
V
 
I
S
 
K
I
x
Q
P
 
D
A
x
F
E
 
R
R
 
L
M
 
L
G
 
G
R
 
Q
G
 
T
A
 
S
L
 
V
E
 
D
L
 
R
V
 
L
M
 
L
A
 
Q
H
 
L
L
 
S
S
 
Q
G
 
G
R
 
Q
P
 
A
T
 
V
A
 
K
G
 
G
T
 
N
T
 
Q
L
 
L
I
 
L
A
 
P
P
 
V
E
 
S
L
 
L
A
 
V
V
 
K
R
 
R
E
 
K
S
 
T
S
 
T

7ce1S Complex structure of transcription factor sghr with its cognate DNA (see paper)
26% identity, 48% coverage: 3:162/334 of query aligns to 4:165/259 of 7ce1S

query
sites
7ce1S
T
 
T
L
|
L
A
 
K
E
 
T
V
 
I
A
 
A
A
 
Y
R
 
M
A
 
T
G
 
G
V
 
L
S
x
G
A
 
I
S
x
T
T
|
T
V
 
V
S
|
S
Y
 
R
V
 
A
I
 
L
S
x
K
G
 
D
K
 
A
R
 
P
S
x
D
I
|
I
S
x
G
Q
 
A
A
 
E
T
|
T
Q
 
K
D
 
E
R
 
R
V
 
V
L
 
R
R
 
L
A
 
I
V
 
A
T
 
Q
E
 
Q
L
 
I
G
 
G
Y
|
Y
H
 
Q
P
 
P
N
|
N
A
 
R
S
 
A
A
 
G
R
 
V
A
 
R
L
|
L
A
x
R
S
 
T
S
 
G
R
 
K
S
 
T
N
 
N
V
 
V
I
 
I
A
 
A
L
 
L
M
 
V
V
 
L
P
 
S
L
 
V
R
 
D
S
 
E
D
 
E
M
 
L
-
 
M
-
 
G
-
 
F
-
 
T
-
 
S
-
 
Q
Y
 
M
V
 
V
P
 
F
V
 
G
I
 
I
M
 
T
E
 
E
I
 
V
V
 
L
-
 
A
-
 
T
-
 
T
-
 
Q
M
 
Y
A
 
H
I
 
L
A
 
V
A
 
V
T
 
T
A
 
P
R
 
H
A
 
T
H
 
H
G
 
A
Q
 
K
D
 
D
I
 
S
L
 
M
L
 
V
L
 
-
T
 
-
G
 
-
G
 
-
E
 
-
G
 
-
P
 
-
D
 
-
G
 
P
V
 
I
R
 
R
R
 
Y
V
 
I
A
 
L
G
 
E
T
 
T
G
 
G
L
 
S
A
 
A
D
 
D
A
 
G
I
 
V
I
 
I
L
 
I
M
 
S
D
 
K
V
 
I
E
 
E
L
 
P
D
 
N
D
 
D
K
 
P
R
 
R
I
 
V
P
 
R
V
 
F
L
 
M
R
 
T
E
 
E
A
 
R
S
 
K
M
 
M
P
 
P
A
 
F
V
 
V
L
 
T
I
 
H
G
 
G
L
 
R
P
 
S
S
 
D
D
 
M
T
 
G
A
 
I
D
 
E
L
 
H
T
 
A
C
 
Y
I
 
H
D
 
D
L
 
F
D
 
D
F
 
N
E
 
E
A
 
A

Query Sequence

>WP_037568880.1 NCBI__GCF_000744815.1:WP_037568880.1
MVTLAEVAARAGVSASTVSYVISGKRSISQATQDRVLRAVTELGYHPNASARALASSRSN
VIALMVPLRSDMYVPVIMEIVMAIAATARAHGQDILLLTGGEGPDGVRRVAGTGLADAII
LMDVELDDKRIPVLREASMPAVLIGLPSDTADLTCIDLDFEATGAACADHLADLGHRDIA
LIGESRSVYQRRTGFAARTLEGFRQRARARGVRAVHRPCEGTFESTAGVLTRILEERPET
SGFVVQNEAAIRPLLTLLRQFGRVVPEDASVVAICPESVALQSSPQLTSVSIPAERMGRG
ALELVMAHLSGRPTAGTTLIAPELAVRESSLSAG

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory