Document the new migration tool
[git.git] / Documentation / cvs-migration.txt
1 Git for CVS users
2 =================
3
4 Ok, so you're a CVS user. That's ok, it's a treatable condition, and the
5 first step to recovery is admitting you have a problem. The fact that
6 you are reading this file means that you may be well on that path
7 already.
8
9 The thing about CVS is that it absolutely sucks as a source control
10 manager, and you'll thus be happy with almost anything else. Git,
11 however, may be a bit _too_ different (read: "good") for your taste, and
12 does a lot of things differently. 
13
14 One particular suckage of CVS is very hard to work around: CVS is
15 basically a tool for tracking _file_ history, while git is a tool for
16 tracking _project_ history.  This sometimes causes problems if you are
17 used to doing very strange things in CVS, in particular if you're doing
18 things like making branches of just a subset of the project.  Git can't
19 track that, since git never tracks things on the level of an individual
20 file, only on the whole project level. 
21
22 The good news is that most people don't do that, and in fact most sane
23 people think it's a bug in CVS that makes it tag (and check in changes)
24 one file at a time.  So most projects you'll ever see will use CVS
25 _as_if_ it was sane.  In which case you'll find it very easy indeed to
26 move over to Git. 
27
28 First off: this is not a git tutorial. See Documentation/tutorial.txt
29 for how git actually works. This is more of a random collection of
30 gotcha's and notes on converting from CVS to git.
31
32 Second: CVS has the notion of a "repository" as opposed to the thing
33 that you're actually working in (your working directory, or your
34 "checked out tree").  Git does not have that notion at all, and all git
35 working directories _are_ the repositories.  However, you can easily
36 emulate the CVS model by having one special "global repository", which
37 people can synchronize with.  See details later, but in the meantime
38 just keep in mind that with git, every checked out working tree will
39 have a full revision control history of its own.
40
41
42 Importing a CVS archive
43 -----------------------
44
45 Ok, you have an old project, and you want to at least give git a chance
46 to see how it performs. The first thing you want to do (after you've
47 gone through the git tutorial, and generally familiarized yourself with
48 how to commit stuff etc in git) is to create a git'ified version of your
49 CVS archive.
50
51 Happily, that's very easy indeed. Git will do it for you, although git
52 will need the help of a program called "cvsps":
53
54         http://www.cobite.com/cvsps/
55
56 which is not actually related to git at all, but which makes CVS usage
57 look almost sane (ie you almost certainly want to have it even if you
58 decide to stay with CVS). However, git will want at _least_ version 2.1
59 of cvsps (available at the address above), and in fact will currently
60 refuse to work with anything else.
61
62 Once you've gotten (and installed) cvsps, you may or may not want to get
63 any more familiar with it, but make sure it is in your path. After that,
64 the magic command line is
65
66         git cvsimport -d <cvsroot> <module> <destination>
67
68 which will do exactly what you'd think it does: it will create a git
69 archive of the named CVS module. The new archive will be created in the
70 subdirectory named <destination>; it'll be created if it doesn't exist.
71 Default is the local directory.
72
73 It can take some time to actually do the conversion for a large archive
74 since it involves checking out from CVS every revision of every file,
75 and the conversion script can be reasonably chatty, but on some not very
76 scientific tests it averaged about twenty revisions per second, so a
77 medium-sized project should not take more than a couple of minutes.  For
78 larger projects or remote repositories, the process may take longer.
79
80 After the import is done, do this:
81
82         cp .git/refs/heads/<branch> .git/refs/heads/master
83         git-read-tree
84         git-checkout-cache -q -f -u -a
85
86 The head branch is named "origin" by default; you can change that using
87 the '-o' option to "git cvsimport".
88
89 The import is incremental, i.e. if you call it again next month it'll
90 fetch any CVS updates that have been happening in the meantime. You can
91 then merge those updates into your main branch:
92
93         cg-merge <branch>
94
95
96 Emulating CVS behaviour
97 -----------------------
98
99
100 FIXME! Talk about setting up several repositories, and pulling and
101 pushing between them. Talk about merging, and branches. Some of this
102 needs to be in the tutorial too.
103
104
105
106 CVS annotate
107 ------------
108
109 So, something has gone wrong, and you don't know whom to blame, and
110 you're an ex-CVS user and used to do "cvs annotate" to see who caused
111 the breakage. You're looking for the "git annotate", and it's just
112 claiming not to find such a script. You're annoyed.
113
114 Yes, that's right.  Core git doesn't do "annotate", although it's
115 technically possible, and there are at least two specialized scripts out
116 there that can be used to get equivalent information (see the git
117 mailing list archives for details). 
118
119 Git has a couple of alternatives, though, that you may find sufficient
120 or even superior depending on your use.  One is called "git-whatchanged"
121 (for obvious reasons) and the other one is called "pickaxe" ("a tool for
122 the software archeologist"). 
123
124 The "git-whatchanged" script is a truly trivial script that can give you
125 a good overview of what has changed in a file or a directory (or an
126 arbitrary list of files or directories).  The "pickaxe" support is an
127 additional layer that can be used to further specify exactly what you're
128 looking for, if you already know the specific area that changed.
129
130 Let's step back a bit and think about the reason why you would
131 want to do "cvs annotate a-file.c" to begin with.
132
133 You would use "cvs annotate" on a file when you have trouble
134 with a function (or even a single "if" statement in a function)
135 that happens to be defined in the file, which does not do what
136 you want it to do.  And you would want to find out why it was
137 written that way, because you are about to modify it to suit
138 your needs, and at the same time you do not want to break its
139 current callers.  For that, you are trying to find out why the
140 original author did things that way in the original context.
141
142 Many times, it may be enough to see the commit log messages of
143 commits that touch the file in question, possibly along with the
144 patches themselves, like this:
145
146         $ git-whatchanged -p a-file.c
147
148 This will show log messages and patches for each commit that
149 touches a-file.
150
151 This, however, may not be very useful when this file has many
152 modifications that are not related to the piece of code you are
153 interested in.  You would see many log messages and patches that
154 do not have anything to do with the piece of code you are
155 interested in.  As an example, assuming that you have this piece
156 code that you are interested in in the HEAD version:
157
158         if (frotz) {
159                 nitfol();
160         }
161
162 you would use git-rev-list and git-diff-tree like this:
163
164         $ git-rev-list HEAD |
165           git-diff-tree --stdin -v -p -S'if (frotz) {
166                 nitfol();
167         }'
168
169 We have already talked about the "--stdin" form of git-diff-tree
170 command that reads the list of commits and compares each commit
171 with its parents.  The git-whatchanged command internally runs
172 the equivalent of the above command, and can be used like this:
173
174         $ git-whatchanged -p -S'if (frotz) {
175                 nitfol();
176         }'
177
178 When the -S option is used, git-diff-tree command outputs
179 differences between two commits only if one tree has the
180 specified string in a file and the corresponding file in the
181 other tree does not.  The above example looks for a commit that
182 has the "if" statement in it in a file, but its parent commit
183 does not have it in the same shape in the corresponding file (or
184 the other way around, where the parent has it and the commit
185 does not), and the differences between them are shown, along
186 with the commit message (thanks to the -v flag).  It does not
187 show anything for commits that do not touch this "if" statement.
188
189 Also, in the original context, the same statement might have
190 appeared at first in a different file and later the file was
191 renamed to "a-file.c".  CVS annotate would not help you to go
192 back across such a rename, but GIT would still help you in such
193 a situation.  For that, you can give the -C flag to
194 git-diff-tree, like this:
195
196         $ git-whatchanged -p -C -S'if (frotz) {
197                 nitfol();
198         }'
199
200 When the -C flag is used, file renames and copies are followed.
201 So if the "if" statement in question happens to be in "a-file.c"
202 in the current HEAD commit, even if the file was originally
203 called "o-file.c" and then renamed in an earlier commit, or if
204 the file was created by copying an existing "o-file.c" in an
205 earlier commit, you will not lose track.  If the "if" statement
206 did not change across such rename or copy, then the commit that
207 does rename or copy would not show in the output, and if the
208 "if" statement was modified while the file was still called
209 "o-file.c", it would find the commit that changed the statement
210 when it was in "o-file.c".
211
212 [ BTW, the current versions of "git-diff-tree -C" is not eager
213   enough to find copies, and it will miss the fact that a-file.c
214   was created by copying o-file.c unless o-file.c was somehow
215   changed in the same commit.]
216
217 You can use the --pickaxe-all flag in addition to the -S flag.
218 This causes the differences from all the files contained in
219 those two commits, not just the differences between the files
220 that contain this changed "if" statement:
221
222         $ git-whatchanged -p -C -S'if (frotz) {
223                 nitfol();
224         }' --pickaxe-all
225
226 [ Side note.  This option is called "--pickaxe-all" because -S
227   option is internally called "pickaxe", a tool for software
228   archaeologists.]